網際論壇 - 硬體技術交流 - 〔注意〕Radeon HD 4870 1GB推出

» 遊客: 註冊 | 登錄 | 會員 | 幫助

網際論壇 » 硬體技術交流 » 〔注意〕Radeon HD 4870 1GB推出

動漫分類：最新上架｜熱門連載｜全本小說｜最新上架｜玄幻奇幻｜都市言情｜武俠仙俠｜軍事歷史｜網游競技｜科幻靈異 ... 更多小說

virusG
中級會員 Level：3 級

積分 1044
發文 64
註冊 2008-8-11
狀態離線

#1 〔注意〕Radeon HD 4870 1GB推出

介紹
Radeon HD 4870原本就在與GeForce GTX 260的對話中占得上風，此後NVIDIA緊急發布了具備216個流處理器的新版GeForce GTX 260 core 216，這樣不但在顯存上繼續保持了優勢，還在核心性能上有了足夠的資本。不過AMD并沒有放棄這塊市場的争奪，新版1GB Radeon HD 4870也已經發布。在我們的測試中，你将會看到1GB版相對于512MB版的巨大領先優勢。

Redeon HD 4800系列在流處理器數量上有了質的飛躍，從R600的320個一下子躍遷到RV770的800個！暫不考慮其他部件的影響，流處理器大幅度的提高，晶體管集成數卻隻從RV670的6.6億上升到了RV770的9.6億。是的，RV770的效率非常高，相比RV670，AMD僅僅将核心尺寸提高了30%而已，它們同樣都是55nm制造工藝的産物。

RV770繼承了RV670所有的優秀特性，比如支持DirectX 10.1，擁有tessellation單元，支持PCI Express 2.0。此外AMD還增加了一個全新的統一視頻解碼引擎，這種引擎可以接受闆卡本身發出的微操作，這可以幫助顯卡更好的适應當前的應用環境。微操作還控制着頻率、電壓等，這可以保證核心更有效的工作和節能。

物理運算？

你也不能忽視了AMD基于圖形芯片的物理運算特性，AMD已經與Intel在這方面進行合作，讓顯卡加速物理運算成爲可能，Intel目前擁有物理引擎Havok的版權。不過當事雙方還沒有做出任何正式申明，而當這一切最終成真，那麽我們可能會看到圖形芯片很好的進行物理運算，運算速度可能達到CPU的幾十倍，甚至幾百倍。

所有的規格參數與特性都表明，RV770可以比一般CPU做得更好，特别是在物理運算方面。當然，就目前而言，他們還沒有辦法取代CPU在遊戲中全面負責物理運算，不過圖形處理器的強大性能已經嶄露頭角。我們當前還不得不等待，等待有一天可以看到，在顯卡高性能運算幫助下，遊戲的物理效果究竟可以達到什麽程度。

架構簡述

RV770的架構還是延用了上一代統一渲染架構，當然改進的地方很多。在這個架構中，主要由Command Processor、Setup Engine、Ultra-Threaded Dispatch Processor、Stream Processing Units、Texture Units、Cache & Buffer、Shader Export Render Back-Ends和Memory Control等單元組成。RV770主要改進的地方集中在Stream Processing Units、Texture Units和Render Back-Ends部分。

作爲RV770架構最核心的部分，流處理器單元至關重要。ATI的統一着色單元稱爲Stream Processing Units，而NVIDIA産品中統一着色單元稱爲Streaming Processors，兩家雖然都稱爲流處理器，但結構完全不同。對于ATI而言，流處理器單元和流處理器是不同的，每個Units内部包含5個超标量ALU ，這5個ALU共用一個指令發射端，卻能同時執行5個通道的數據，這就是SIMD架構，一個時鍾周期可以進行5次MAD運算。

運算部件

在運算部件中，其中大一點的ALU還能夠進行一些特殊運算，比如SIN、COS、LOG、EXP等函數，因此可以說一個Stream Processing Units實際上是包含有5個Stream Processing的，這就是我們常說的4D+1D超标量SIMD架構。而NVIDIA的每個流處理器就是1D标量，屬于純标量MIMD架構。對于RV770而言，擁有160個Stream Processing Units，也就是說一共有800個Stream Processing。

每16個Stream Processing Units組成一個SIMD矩陣，每個SIMD矩陣内含有80個SP，比起RV670的4個SIMD矩陣320個SP完全是一種從量變到質變的飛躍過程。每個SIMD矩陣對應有一個紋理單元，RV770的紋理單元比上一代作過優化，紋理緩存帶寬是HD 3000系列的兩倍，每平方毫米性能增加70%，在每個紋理單元均内含4個Texture Address Unit、4個Texture Filter Unit，因此10個紋理單元一共有84個TAU和40個TFU，比起RV670的32/16個均有大幅提高，對遊戲的執行效率将會有顯著幫助。

紋理單元與tesselator單元

我們發現，在RV770中每個SIMD矩陣還對應有一個Local Data Share，其大小16KB，在以往的RV670架構圖中并沒有發現類似功能部分。這樣的話，每個SIMD矩陣内，流處理器與流處理器間能共享信息，省下了從外部緩存系統中讀取信息的時間，這種設計大大加快了處理器的運算速度，同時提高了各種算法的效率，這與NVIDIA GeForce GTX200内部的TPC加入緩存的思想相類似。

有一點要提到的就是AMD的Programmable Tessellator可編程鑲嵌單元，在Setup Engine部分可以見到它，AMD稱在RV770中強化了這一部分的性能。簡單的說，Tessellator可單純使用GPU創建不同複雜程度的多邊形模型，降低開發難度、改進程序性能，它能夠在圖形芯片内部自動創造頂點，使模型細化，從而獲得更好畫面效果。Tessellator并不隸屬于DirectX 10标準的技術，不過DirectX 10.1标準已将它納于麾下，它最重要的是在保證了非常好的視覺效果的前提下節約了性能，讓一個程序的運行速度能夠保證在很好的水平。

更多图表评测结果

2008-11-4 01:05 PM

可打印版本 | 推薦給朋友 | 訂閱主題 | 收藏主題

論壇跳轉選單：