編輯:電腦系統城 2020-12-14 14:22:53 來源于:www.farandoo.com
大家都都知道,在陸續發布了RTX 3090/80/70之后,NVIDIA終于又開始了全新的動作,但讓大家絕對沒有想到的是,發布的新品竟然是RTX 3060Ti,很讓大家驚訝。一般來說帶有Ti后綴的顯卡會在普通版本發布后幾個月再推出,同時一般大家最早見到的會是80Ti級別的顯卡。筆者這次拿到了一張影馳 RTX 3060Ti 金屬大師 OC顯卡,可以給大家仔細評測一番,感興趣的朋友不要錯過了。
這一代3060Ti確實是筆者最期待的一款產品,它也必將會有非常出色的銷量。至于原因嘛,非常簡單,甜品級別的價格卻能帶來超越前代次旗艦的性能,自然會讓每個人都想把它收入懷中。
影馳RTX 3060Ti 金屬大師 OC
這次,筆者就對影馳的一款RTX 3060Ti 金屬大師 OC顯卡進行評測,讓大家通過這款性能出色外觀好看的非公版顯卡,更加直觀的對RTX 3060Ti顯卡增加了解。
01 特點簡介及購買建議
按照慣例,在文章開頭,筆者會向大家簡單介紹一下影馳RTX 3060Ti金屬大師 OC的主要特點,方便大家對產品建立起初步的印象,然后結合售價給出購買建議,再進行細致評測。
1、以60級別的售價給出超越80S的性能表現,并進行了出廠預超頻。甜品價格,旗艦性能
2、全金屬上蓋,堅固耐用冰冷有質感
3、三風扇散熱,靜音速冷
4、光線追蹤、DLSS等功能加持,游戲畫面更加真實暢爽
購買建議:影馳RTX 3060Ti金屬大師 OC的定價為3199元,厚道的讓人難以置信。雖然它定位于甜品級別,但實際上的性能已經超越了前代的次旗艦級別80S系列,價格卻依舊保持在甜品價位段,讓人不由得不心動。其外觀冷酷帥氣,散熱表現出色,性能方面足以通吃3A大作,是游戲玩家們近期裝機的優秀選擇。
02 金屬外殼 冷酷帥氣
影馳RTX 3060Ti金屬大師 OC顯卡的具體尺寸為318×107×49mm。系列大量使用金屬,冷酷又堅固的設計風格被很好的延續了下來。和這一系列的其他產品一樣,3060Ti金屬大師采用了全鋁合金的上蓋設計,純銀色的金屬外觀頗具質感,純金屬背板同樣為銀色,保持了很好的統一性。
全鋁合金上蓋
無論是上蓋還是背板,都進行了復雜的幾何設計和鏤空切割,在保證美觀的同時兼顧了使用強度和散熱透氣。影馳RTX 3060Ti金屬大師 OC在背板的圓環狀鏤空中間,還有影馳金屬大師logo的露出,非常帥氣。
頗具設計感的鏤空背板
背板甚至在邊緣處進行了彎曲,從而對PCB板進行格外加強的保護。同時,我們可以看到,影馳RTX 3060Ti金屬大師 OC顯卡采用單8PIN供電,其設計TGP為220W,推薦電源功率為650W以上。
背板彎曲 增強保護
影馳RTX 3060Ti金屬大師 OC的散熱方面,三個90mm風扇組成的寒光星散熱系統很好的完成散熱工作,靜霜三折扇葉的獨特形狀可以提高風量,減少噪音。
90mm散熱風扇
03 NVIDIA Ampere架構下RTX 3060 Ti
影馳RTX3060 Ti金屬大師OC采用了NVIDIA Ampere架構,我們首先來看一下RTX 3060 Ti的提升。
第一代RTX架構 Turing下的RTX 2060 SUPER
第二代RTX架構 Ampere下的RTX 3060 Ti
相較于初代的Turing RTX架構,NVIDIA Ampere架構在算力上有著成倍的增長,這一點在RTX 3060 Ti中依舊有體現,每個時鐘執行2次著色器運算,而Turing為1次,RTX 3060 Ti的著色器性能達到16.2 TFLOPS單精度性能,而Turing為7.2 TFLOPS。
NVIDIA Ampere架構翻倍了光線與三角形的相交吞吐量,RT Core達到31.6 RT TFLOPS,而Turing為21.7 RT TFLOPS。
全新的Tensor Core可自動識別并消除不太重要的DNN權重,處理稀疏網絡的速率是Turing的兩倍,算力高達129.6 Tensor TFLOPS,而Turing為57.4 Tensor TFLOPS。
RTX 3060 Ti采用GA104核心擁有174億個晶體管,392平方毫米的面積,基于三星的8nm NVIDIA定制工藝,另外在RTX 3060 Ti中我們都知道仍然采用了GDDR6顯存,不過不同于RTX 3080的Micron,RTX 3060 Ti采用了三星的GDDR6顯存。
我們在發布會中經常聽到性能翻倍的說法,其實是因為本次NVIDIA Ampere架構的SM在Turing基礎上增加了一倍的FP32運算單元,這就使得每個SM的FP32運算單元數量提高了一倍,同時吞吐量也就變為了一倍。
而通常我們計算顯卡的CUDA數量,并不是把SM中的所有單元加起來計數,而是只統計FP32單元的數量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變為 2:1。
RTX 3060 Ti共有4864個CUDA,其實它有2432個INT32單元,但由于內部的FP32數量翻了一倍,所以最終實現了4864這個驚人的數字。
而這樣粗暴的提升CUDA數量對于游戲其實有著非常大的幫助,通常在游戲中浮點運算相比整數計算要常用的多,圖形、算法以及各種計算操作中著色器工作負載通常需要混合使用FP32算數指令,而FP32的加速也有助于光線追蹤降噪著色器。
光追工作原理示意
在此次的NVIDIA Ampere架構中,NVIDIA官方宣布為第二代RT Core,它和第一代有什么不同呢。首先要知道RT Core的工作原理是,著色器發出光線追蹤的請求,交給RT Core來處理,它將進行兩種測試,分別為邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersection testing)?;贐VH算法來判斷,如果是方形,那么就返回縮小范圍繼續測試,如果是三角形,則反饋結果進行渲染。
而光線追蹤最耗時的正是求交計算,因此,要提升光線追蹤性能,主要是對兩種求交(BVH/三角形求交)進行加速。
RT Core的變化
在Turing的RT Core中,可以每個周期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一個新的三角形位置插值模塊以及一個的額外的三角形求交模塊,這樣做的目的是為了提升諸如運動模糊特效時候的光線追蹤性能。
運動模糊渲染原理
第二代RT Core可以讓光線追蹤與著色同時進行,進行的光線追蹤越多,加速就越快,它將光線相交的處理性能提升了一倍,在渲染有動態模糊的影像時,按照NVIDIA自己的實測,比Turing快8倍。
稀疏深度學習
Tensor Core可以看作是GeForce RTX GPU上的AI大腦??杉铀儆糜谏疃壬窠浘W絡處理功能的線性代數,這是現代AI的基礎。例如用于AI超分辨率的NVIDIA DLSS和用于AI增強的聲畫處理技術NVIDIA Broadcast應用。
在本次的NVIDIA Ampere架構的Tensor Core也得到了極大地加強,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動識別并消除不太重要的DNN(深度神經網絡)權重,同時依然能保持不錯的精度。
首先原始的密集矩陣會經過訓練,刪除掉稀疏矩陣,再經過訓練稀疏矩陣,從而實現稀疏優化,進而提高Tensor Core的性能。
與此次RTX 30系顯卡一同發布的還有一項新技術——RTX IO。目前很多游戲動輒幾十G甚至百G的安裝空間,對于存儲空間的負擔暫且不提,但存放在硬盤中的數據,如果顯卡想要讀取到,需要先由CPU從硬盤中讀取壓縮過的數據,經過解壓縮再發送到顯存中。
雖然隨著NVMe SSD的推出,讀取速度相較機械硬盤能夠快20倍,但受制于傳統I/O限制,NVMe高達7GB/秒的高速讀寫對于CPU是極大的負擔。
傳統的數據交換
在這個過程中,會占用多個CPU核心,壓力急劇增大,占用較多的內存,而此時其實GPU是處于閑置狀態的。RTX IO的作用就是越過CPU解壓再傳輸數據這一步,直接從PCIE總線讀取硬盤上經過壓縮的數據,并且完成無損GPU解壓,降低CPU占用,變向提升了性能。
RTX IO可以極大解放CPU負擔
當然這項技術作為系統底層的運行方式改變,還需要借助微軟發布的DirectStorage來實現,對于目前容量的游戲來說,RTX IO的改善效果有限,但假以時日等游戲容量上百G成為常態的時候,這項技術將會發揮巨大的功效。
同時搭配新增的HDMI 2.1接口,可以支持單線8K的視頻輸出,而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出,如果想要連接8K電視,則需要更多的線纜支持。
04 強大核心 出廠超頻 用料厚道
首先介紹一下測試平臺,為了保證此次評測能夠發揮影馳 RTX 3060 Ti金屬大師 OC 顯卡的最佳性能,主板和CPU采用了目前桌面旗艦級配置,具體如下。
配置信息
首先看一下GPU-Z的參數,影馳 RTX 3060 Ti 金屬大師 OC 顯卡使用了GA104芯片,芯片采用8nm工藝制成,擁有4864組CUDA核心,其核心頻率為1410-1750MHz,進行了出廠超頻,比公版性能更強。顯卡采用8GB GDDR6顯存,位寬為256bit,顯存帶寬達到了448GB/s,光柵單元和紋理單元為80和152。
GPU-Z參數
下面先進行的是用來衡量顯卡DX11理論性能的3DMARK FS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:
3D MARK FS套裝測試
在針對顯卡DX11性能的3DMARK FS套裝測試中,我們主要對比影馳 RTX 3060 Ti 金屬大師 OC和RTX 2080 SUPER,整體來看各項成績中均小幅領先RTX 2080 SUPER。
2022-04-19
GTX1660顯卡搭配顯示器推薦 GTX1660用什么顯示器好2022-04-19
i76700處理器相當于i5幾代 i76700怎么樣2022-04-19
i5-10400f相當于i7多少 i5-10400f處理器怎么樣i7 7700和i7 7700k是兩個比較常見的cpu類型,雖然只是相差一個“k”字,但在性能上卻是截然不同,那么到底哪款性價比要高呢?兩者到底相差多少呢?下面小編帶來i7-7700和i7-7700k區別對比...
2022-04-13
2022年1月5日,英偉達發布了RTX3090Ti旗艦級顯卡,采用了完整的GA102核心,共84組SM單元,相比RTX3090多了2組,開放了全部的SM單元,同時頻率和功耗也都有所增高,它的來臨將會取代RTX3090成為最強的RTX系列GPU。那么RTX3090Ti顯卡...
2022-04-12