A mikroprocesszorok technológiai fejlődése a modern digitális társadalom és a nagyteljesítményű számítástechnika (HPC) motorja. Bár a félvezetőipar hajnalán éles viták övezték, hogy kit illet a feltaláló érdeme, a történelmi konszenzus szerint az első kereskedelmi forgalomban megjelent egycsipes mikroprocesszor az Intel 4004 volt.
Minden a CPU-ról. A Federico Faggin, Marcian Hoff, Stanley Mazor és Masatoshi Shima által tervezett, eredetileg a Busicom kalkulátorgyártó cég egyedi megrendelésére fejlesztett chip 1971-ben debütált. A mindössze 2300 tranzisztort tartalmazó, fizikai méretében egy tízcentisnél is kisebb szilíciumlapka megalapozta a mikroelektronikai integráció robbanásszerű fejlődését. Az Intel 4004-et 1972-ben követte az Intel 8008, amely a világ első 8 bites mikroprocesszoraként vonult be a történelembe. Ez a konstrukció nem a 4004 közvetlen kiterjesztése volt, hanem egy párhuzamos projektből született, amelynek szoftveres utasításkészletét és belső logikáját a Computer Terminals Corporation (CTC) mérnökei, Vic Poor és Harry Pyle fektették le a Datapoint 2200 terminálhoz. Bár a CTC végül nem használta fel az elkészült chipet, az Intel licencmentes értékesítési jogot szerzett, ami elindította az otthoni számítógépes forradalmat.
![]()
A tranzisztorok sűrűségének és komplexitásának növekedése évtizedeken át szigorúan követte a Gordon Moore által 1965-ben megfogalmazott Moore-törvényt. Az eredeti megfigyelés szerint a chipekre integrálható komponensek száma kétévente megduplázódik, ami exponenciális teljesítménynövekedést és ezzel egyidejűleg drasztikus költségcsökkenést eredményez. Moore jóslata elképesztő pontossággal bizonyult igaznak: az 1965-ös publikációban előrejelzett 65 000 tranzisztoros integrációs határt 1975-ben az iparág szinte pontosan egy százalékos hibahatáron belül teljesítette egy új memóriachip kibocsátásával.
Az ezt követő évtizedekben a mikroarchitektúrák fejlődése látványos mérföldköveket produkált a tranzisztorszámok növekedésében. Az 1979-ben bemutatott Motorola 68000 már 68 000 tranzisztort mozgósított a 32 bites belső feldolgozás érdekében, míg az 1991-es MIPS R4000 1,35 millió tranzisztorral elindította a 64 bites korszakot. Az Intel Pentium 1993-as megjelenése 3,1 millió tranzisztorral szilárdította meg az x86-os architektúra dominanciáját a személyi számítógépek piacán. A kétezres évek közepén a hagyományos egymagos processzorok elérték a fizikai órajel-korlátokat, ami az AMD Athlon 64 X2 2005-ös bemutatásával elindította a többmagos (multi-core) korszakot, 233,2 millió tranzisztorral megvalósítva a párhuzamos feldolgozást. Napjaink szuperszámítógépes és szerverpiaci processzorai, mint például a 2020-ban megjelent AMD Ryzen Threadripper 3990X, már megdöbbentő, 39,54 milliárd tranzisztort tartalmaznak egyetlen tokozáson belül.
Ez a megállíthatatlan skálázás azonban a 2020-as évek közepére elérte a szilíciumtechnológia fizikai határait. A nanométeres tartományba lépve a tranzisztorok kapuoxid-vastagsága már csak néhány atomnyi, ami felerősíti a kvantumalagút-hatást, megnövelve a szivárgási áramokat. Ezzel párhuzamosan fellép a "sötét szilícium" (dark silicon) jelensége: a chip bizonyos részeit inaktívan kell tartani az órajelciklusok alatt, különben a keletkező hő elvezethetetlenné válna, és a processzor fizikai megsemmisülését okozná. Míg az Intel 4004 mindössze 0,5 W energiát fogyasztott, a modern asztali és szerverprocesszorok fogyasztása eléri a 350 W-ot. Ha a tranzisztorok energiafogyasztása nem csökkent volna arányosan a méretükkel, egy modern, 22 millió szoros tranzisztorsűrűség-növekedést mutató chip működtetéséhez egy kisebb atomerőmű teljesítményére (11 MW) lenne szükség.
A hardveres skálázás lassulásának ellensúlyozására alkotta meg a szakma az EROOM-törvény koncepcióját. Míg a Moore-törvény a hardveres komplexitás növelését helyezte fókuszba, az EROOM-törvény a szoftveres optimalizáció kétévenkénti megduplázását írja elő. Ez azt jelenti, hogy a szoftverek finomhangolásával és hatékonyabb algoritmusokkal kétévente felére csökkenthető a kód futtatásához szükséges számítási erőforrások mennyisége, biztosítva a folyamatos rendszerszintű fejlődést a fizikai korlátok elérése ellenére is.
Az utasítás-végrehajtás mikroarchitekturális mechanizmusai
Minden szoftver, a legegyszerűbb beágyazott kódtól a legbonyolultabb neurális hálózatig, végső soron alacsony szintű, bináris gépi nyelvű utasítások sorozatára bomlik le, amelyeket a processzor közvetlenül hajt végre. A központi feldolgozó egység (CPU) ezt a feladatot az utasításciklus (Fetch-Decode-Execute cycle) végtelenített ismétlésével végzi a számítógép rendszerindításától egészen a kikapcsolásig.

A CPU belső működése során szorosan együttműködik a rendszermemóriával (RAM) és a belső regiszterekkel három alapvető kommunikációs csatornán, az úgynevezett buszrendszeren keresztül :
-
Címbusz (Address Bus): Egyirányú busz, amelyen keresztül a CPU kiküldi a hozzáférni kívánt memória- vagy I/O-címeket.
-
Adatbusz (Data Bus): Kétirányú adatútvonal, amely a tényleges utasításokat és adatokat szállítja a memória és a CPU regiszterei között.
-
Vezérlőbusz (Control Bus): A vezérlőegység által küldött szinkronizációs és vezérlőjeleket (pl. memórialvasás, memóriaírás, megszakításkérelmek) továbbítja a rendszer elemei felé.
Az utasításciklus három fő szakasza rendkívül szigorú regiszterszintű tranzakciókra épül :
1. Lehívási szakasz (Fetch Stage)
Az utasításciklus kezdetén a programszámláló (Program Counter - PC) tárolja a következő végrehajtandó gépi kódú utasítás memóriacímét. Ezt a címet a CPU átmásolja a memóriacím-regiszterbe (Memory Address Register - MAR). A MAR-ból a cím az address buszon keresztül kiküldésre kerül a főmemóriához. Ezzel egy időben a vezérlőegység (Control Unit - CU) egy olvasási parancsot küld a vezérlőbuszon keresztül. A memóriavezérlő dekódolja a címet, beolvassa a RAM-ból az ott tárolt bináris kódot, és ráhelyezi a databusra. Az adatbuszról az utasítás a CPU memóriaadat-regiszterébe (Memory Data Register - MDR) töltődik be. Ezzel párhuzamosan a programszámláló (PC) értéke automatikusan növekszik eggyel (vagy az utasításszó hosszával), hogy már a következő utasítás címére mutasson. Az MDR-ből az utasítás átmásolódik az aktuális utasításregiszterbe (Current Instruction Register - CIR, vagy Instruction Register - IR). Rendkívül fontos elméleti szempont, hogy ebben a fázisban semmilyen szemantikai elemzés nem történik; a CPU pusztán fizikai adatmozgatást végez a memória és a belső regiszterek között.
2. Dekódolási szakasz (Decode Stage)
A CIR-be bekerült bináris utasítást a vezérlőegység (CU) elemzi és értelmezi. Az utasításszó felépítése szerint két alapvető részre tagozódik :
-
Opkód (Opcode - Operation Code): Meghatározza az elvégzendő művelet típusát (pl. aritmetikai összeadás, logikai összehasonlítás, adatmozgatás, elágazás vagy ugrás).
-
Operandus (Operand): Meghatározza a műveletben részt vevő adatokat, vagy azon regiszterek, illetve memóriacímek helyét, ahonnak az adatokat be kell olvasni.
A dekódolás során a CU aktiválja a szükséges belső logikai kapukat, meghatározza, hogy hány további operandust kell esetlegesen beolvasni a memóriából, és felkészíti a célegységeket (pl. az aritmetikai-logikai egységet vagy a lebegőpontos koprocesszort) a művelet végrehajtására. Ebben a fázisban tényleges adatfeldolgozás vagy számítás még nem megy végbe.
3. Végrehajtási szakasz (Execute Stage)
A végrehajtási fázisban a dekódolt utasítás alapján a célegységek elvégzik a tényleges munkát. Ha az utasítás matematikai vagy logikai műveletet írt elő, az Aritmetikai-Logikai Egység (ALU) elvégzi a számítást a regiszterekből kapott adatokon. Amennyiben adatmozgásról van szó, az adatok átmásolódnak a regiszterek és a memória között. Ha az ALU eredménye alapján egy feltételes elágazást kell végrehajtani (pl. egy ciklus vagy logikai elágazás esetén), a programszámláló (PC) értéke közvetlenül felülírásra kerül az új elágazási címmel, ezáltal megváltoztatva a végrehajtás szekvenciális folyamatát. Az eredmény végül visszaírásra kerül egy belső regiszterbe (pl. az akkumulátorba) vagy a memóriába.
Az egyszerűbb processzorok ezt a ciklust szigorúan egymás után, sorrendben hajtják végre. Ezzel szemben a modern, nagyteljesítményű CPU-k utasítás-futószalagot (instruction pipeline) alkalmaznak. A futószalag technológia lehetővé teszi, hogy a ciklus fázisai párhuzamosan, átlapolva fussanak: miközben az N-edik utasítás éppen a végrehajtási (execute) fázisban van, az N+1-edik dekódolása zajlik a vezérlőegységben, az N+2-edik utasítást pedig ezzel egy időben olvassa be a CPU a memóriából.
Memóriahierarchia és gyorsítótár-architektúra
A modern CPU-k órajele GHz-es nagyságrendű, míg a dinamikus rendszermemória (DRAM) elérése ezzel szemben nagyságrendekkel lassabb, ami létrehozza az úgynevezett "memóriafalat" (memory wall). Ennek áthidalására a számítógépes architektúrák többszintű gyorsítótár-hierarchiát (cache hierarchy) alkalmaznak, amely gyors, statikus RAM (SRAM) cellákra épül, és fizikailag a processzormagok közvetlen közelében, vagy magán a szilíciumlapkán helyezkedik el. A gyorsítótár működése a lokalitás két alapvető típusán nyugszik :
-
Temporális lokalitás (Temporal Locality): Ha a CPU hozzáfér egy memóriacímhez, rendkívül valószínű, hogy a közeljövőben ismételten szüksége lesz ugyanarra az adatra (pl. ciklusváltozók, számlálók vagy gyakran hívott függvények esetén).
-
Térbeli lokalitás (Spatial Locality): Ha a CPU hozzáfér egy adott címhez, nagy a valószínűsége annak, hogy a szomszédos memóriacímek tartalmát is be fogja olvasni a közeljövőben (pl. egymás után elhelyezkedő kódsorok végrehajtása vagy tömbelemek bejárása során).
A modern processzorok általában három, ritkábban négy gyorsítótár-szintet integrálnak :
-
L1 gyorsítótár (Level 1 Cache): A leggyorsabb (nanoszekundumos elérési idejű), a processzormagba közvetlenül beépített, kisméretű tároló. Szinte kivétel nélkül megosztott (split) felépítésű: külön L1i (instruction) gyorsítótárat használ az utasítások és külön L1d (data) gyorsítótárat az adatok tárolására.
-
L2 gyorsítótár (Level 2 Cache): Lassabb, de nagyobb kapacitású, magonként dedikált, és általában nem megosztott (unified), azaz közösen tárolja az adatokat és az utasításokat.
-
L3 gyorsítótár (Level 3 Cache): Sokkal nagyobb kapacitású (akár több száz megabájt), de lassabb szint, amelyen az összes processzormag osztozik. Feladata a magok közötti adatmegosztás koordinálása és a lassú RAM-hozzáférések minimalizálása.
Amikor a CPU-nak adatra van szüksége, először az L1-et ellenőrzi. Ha az adat ott van, gyorsítótár-találat (cache hit) történik, és a végrehajtás azonnal folytatódik. Ha az adat hiányzik, gyorsítótár-tévesztés (cache miss) következik be, és a CPU egymás után vizsgálja meg az L2, az L3 szintet, majd végső esetben a rendszermemóriát, miközben az adatot lemásolja a felsőbb szintekre a későbbi gyors elérés érdekében.
A gyorsítótárak soraiban az adatok mellett fontos metaadatok is helyet kapnak :
-
Cache Block (gyorsítótár-blokk): Magát a ténylegesen letárolt adatot tartalmazza.
-
Tag (címke): A memória eredeti fizikai címének egy része, amely azonosítja, hogy melyik memóriablokk van jelenleg a cache-sorban.
-
Flag Bit (jelzőbitek): Jelzi a sor állapotát, például hogy az adat érvényes-e (valid bit) vagy módosítva lett-e (dirty bit).
Inkluzivitási politikák
A gyorsítótár-szintek közötti adatreplikáció szabályozását három fő architektúrális megközelítés határozza meg :
-
Inkluzív gyorsítótár (Inclusive Cache): Az L1 és L2 szinteken található összes adatnak kötelezően jelen kell lennie az L3 gyorsítótárban is. Ez leegyszerűsíti a cache-koherencia fenntartását, mert ha egy másik processzormagnak módosítania kell egy címet, elegendő az L3-at ellenőriznie. Hátránya a kapacitásveszteség az adatok többszörös duplikálása miatt.
-
Exkluzív gyorsítótár (Exclusive Cache): Egy adott memóriablokk szigorúan csak egyetlen gyorsítótár-szinten létezhet. Ha egy adatot beolvasnak az L1-be, az automatikusan törlődik az L2 és L3 szintekről, maximalizálva az egyedi adatok tárolására fordítható effektív kapacitást.
-
Nem-inkluzív gyorsítótár (Non-inclusive Cache): Nem garantálja sem az inkluzivitást, sem az exkluzivitást; a szintek függetlenül kezelik a blokkokat, csökkentve az adminisztrációs terheket.
Írási politikák (Write Policies)
Ha a CPU módosít egy adatot a gyorsítótárban, azt szinkronizálni kell a főmemóriával is. Ennek módját az írási politikák határozzák meg :
-
Write-Through (Átíró gyorsítótár): Minden gyorsítótárba történő írás azonnal propagálódik és végrehajtódik a rendszermemóriában is. Ez folyamatos adatkonzisztenciát biztosít, de drasztikusan lelassítja az írási műveleteket a memóriabusz korlátozott sebessége és a magas késleltetés miatt.
-
Write-Back (Visszaíró gyorsítótár): Az írási művelet kezdetben csak a legfelső cache-szinten (L1) hajtódik végre, és az érintett cache-sor "dirty" (módosított) jelölést kap. A rendszermemóriába vagy az alsóbb gyorsítótár-szintekre történő visszaírás csak akkor történik meg, amikor a módosított sort ki kell üríteni (eviction) egy új adatblokk fogadására. Ez jelentősen csökkenti a memóriabuszt terhelő forgalmat, de bonyolult koherencia-kezelést igényel.
Írási tévesztés (write miss) esetén az írás-allokációs szabályok döntenek a folytatásról :
-
Write-Allocate: A hiányzó adatblokk betöltődik a memóriából a gyorsítótárba, ott történik meg a módosítás, és a sor megkapja a dirty bit jelölést.
-
No-Write-Allocate (vagy Write-Around): A gyorsítótár teljesen kikerülésre kerül; a CPU az adatot közvetlenül a főmemóriába írja be, anélkül, hogy a blokkot betöltené a gyorsítótár-szintekre.
Architektúrális törésvonalak és piaci dinamika: x86, ARM és a feltörekvő RISC-V
Az x86 és az ARM architektúrák közötti versengés 2026-ban elérte a legmagasabb intenzitási fokát, mivel a két technológia korábbi merev piaci elhatárolódása teljesen feloldódott. Történelmileg az Intel és az AMD által uralt x86 platform a komplex utasításkészletű számítástechnikára (CISC) épül, amely bonyolult, hardveresen dekódolt utasításokkal éri el a maximális számítási teljesítményt. Ezzel szemben az ARM az Advanced RISC Machine csökkentett utasításkészletű (RISC) architektúráját alkalmazza, amely egyszerűsített, azonos hosszúságú és gyorsan végrehajtható utasításokkal minimalizálja a tranzisztorszámot, a fogyasztást és a hőtermelést.
Míg korábban az ARM kizárólag a mobil- és beágyazott rendszerek piacát uralta, az x86 pedig az asztali és szerverpiacot, mára mindkét ökoszisztéma jelentős szeletet hasított ki a másik területéből.
Teljesítménybeli és technikai különbségek
-
Nyers teljesítmény és elágazáskezelés: Az x86 architektúra továbbra is megőrzi előnyét a komplex, egyetlen szálon futó, nehéz matematikai számításokban. Cloud VM benchmarkok alapján multi-core lebegőpontos műveletekben az x86 processzorok 323 millió FLOAT QUIP értéket érnek el az ARM 256 milliójával szemben. AES-256 titkosításban az x86 még nagyobb fölényt mutat: másodpercenként 19 milliárd bájtot képes feldolgozni, míg az ARM teljesítménye 9 milliárd bájt. Egy pénzügyi szolgáltatást végző partner AMD EPYC alapú x86-os szerverekre történő átállással 40%-kal gyorsabb kötegelt (batch) adatbázis-feldolgozást ért el az ARM-alapú felhőpéldányokhoz képest.
-
Energiahatékonyság és sávszélesség: Az ARM kiemelkedő teljesítményt nyújt a párhuzamosított felhőalapú és mikroszolgáltatási környezetekben, ahol az energiafogyasztás és a hűtési költség dominál. Egy ARM-alapú szerver (pl. Ampere Altra) teljes terhelés mellett 20–40%-kal kevesebb energiát fogyaszt és kevesebb hőt termel, mint az ekvivalens teljesítményű x86-os változat. Emellett az ARM-alapú AWS Graviton4 processzorok 115–120 GB/s memóriasávszélességet biztosítanak a tipikus x86 szerverek 60–90 GB/s értékével szemben, ami 168%-os előnyt jelent a nagyméretű nyelvi modellek (LLM) következtetési szakaszaiban.
-
Szoftveres kompatibilitás és emuláció: Bár az open-source szoftverek több mint 85%-a már rendelkezik natív ARM64 bináris verzióval, a zárt forráskódú vállalati alkalmazások futtatásához még mindig emulációs rétegekre van szükség. Az x86-os kód ARM platformon történő valós idejű fordítása és emulációja azonnali 20–30%-os teljesítménycsökkenést és kiszámíthatatlan futásidejű hibákat eredményez.
A RISC-V feltámadása és technikai korlátai
Az ARM vs. x86 párharc mellett megjelent a harmadik nagy szereplő, a RISC-V. A RISC-V egy teljesen nyílt, moduláris utasításkészlet-architektúra (ISA), amely licencdíjak és jogdíjak nélkül, szabadon implementálható bárki által. Ez kiküszöböli az ARM Holding szigorú licencmodelljét és az x86-os piac kétszereplős (Intel/AMD) merevségét.
A RISC-V ideális választás beágyazott és IoT rendszerekhez, de 2026-ban még komoly szoftveres és hardveres korlátokkal küzd :
-
Hardveres limitációk: A jelenlegi kereskedelmi RISC-V magok lényegesen alacsonyabb órajelen futnak, mint a kiforrott x86 vagy ARM alternatívák.
-
Szoftveres és fordítóprogrami érettség: Bár az olyan nyelvek, mint a Java, már rendelkeznek működő OpenJDK porttal RISC-V-re, a platformról hiányoznak a több évtizedes szoftveres JIT (Just-In-Time) optimalizációk. A fordítóprogramok (GCC, LLVM) nem képesek olyan hatékony gépi kódot generálni RISC-V-re, mint a konkurens platformokra. Emellett kritikus hiányosságot mutatnak a kézzel optimalizált assembly rutinok (intrinsics) olyan alapvető területeken, mint a kriptográfia, a matematikai függvények és a sztringmanipuláció, így azonos órajelen a RISC-V számítási teljesítménye elmarad a riválisaitól.
A személyi számítógépek és professzionális munkaállomások piacán az x86 megkérdőjelezhetetlen fölényben van az optimális szoftveres támogatás és a nyers teljesítmény miatt, miközben az ARM ultrabookok sikeresen hódítanak a hordozható, hosszú akkumulátor-üzemidejű kategóriákban.
![]()
Az alábbi táblázat bemutatja az asztali és hordozható x86 számítógépes konfigurációk aktuális piaci spektrumát a prémium kategóriától az elérhetőbb opciókig :
| Modell neve | CPU Típus | GPU Típus | Memória / Specifikáció | Ár (CAD) | Státusz |
|---|---|---|---|---|---|
| Ordinary9950X3D |
AMD Ryzen 9 9950X3D |
NVIDIA RTX 5090 |
DDR5, 4K gaming optimalizált |
$8 799.00 |
Aktív / Készleten |
| OrdinaryX870 |
AMD Ryzen 9 9950X3D |
NVIDIA RTX 5090 |
DDR5, hyper-prémium RGB hűtés |
$9 549.00 |
Aktív / Készleten |
| OrdinaryAnivia |
Intel Ultra 7 265KF |
NVIDIA RTX 5080 |
DDR5, egyedi tervezésű glossy gépház |
$5 149.00 |
Aktív / Készleten |
| OrdinaryAkhsan |
AMD Ryzen 9 9800X3D |
NVIDIA RTX 5080 |
DDR5, e-sport fókuszú konfiguráció |
$4 899.00 |
Aktív / Készleten |
| OrdinarySova |
Intel Ultra 7 |
NVIDIA RTX 5070 |
32GB DDR5, beépített folyadékhűtés |
$3 449.00 |
Aktív / Készleten |
| OrdinaryKassadin |
AMD Ryzen 9 9700X |
NVIDIA RTX 5070 |
DDR5, NZXT H6 Flow gépház |
$3 599.00 |
Aktív / Készleten |
| OrdinaryXayah |
AMD Ryzen 5 7600X |
NVIDIA RTX 5070 |
Lian Li Lancool 207, DDR5 |
$2 499.00 |
Aktív / Készleten |
| OrdinaryMalphite |
Intel Ultra 5 245KF |
NVIDIA RTX 5060 |
Dedikált hardveres illesztőprogramok |
$1 999.00 |
Aktív / Készleten |
| OrdinaryNova |
Intel Core Ultra 5 225F |
NVIDIA RTX 5050 8GB |
DDR5 alapú belépő szintű konfiguráció |
$1 679.00 |
Aktív / Készleten |
| OrdinaryZen |
AMD Ryzen 5 7600X |
NVIDIA RTX 5050 8GB |
Stabil DDR5 konfiguráció |
$1 649.00 |
Aktív / Készleten |
| OrdinaryPhantom |
Intel i5-14600KF |
RTX 5070 |
32GB DDR5 |
$2 989.00 |
Aktív / Készleten |
| OrdinaryCore |
Intel i9-14900KF |
RTX 5080 |
DDR5, nagysebességű NVMe SSD |
$5 849.00 |
Aktív / Készleten |
| Ordinary7800X3D |
AMD Ryzen 7 |
NVIDIA RTX 5070 |
DDR5 memóriarendszer |
$3 499.00 |
Eladva / Készlethiány |
| OrdinaryOmen |
AMD Ryzen X3D (9900X) |
GeForce RTX 5070 |
DDR5 platform |
$3 499.00 |
Eladva / Készlethiány |
| OrdinaryJett |
Intel i7-14700KF |
RTX 5080 |
Nagyteljesítményű DDR5 |
$4 299.00 |
Eladva / Készlethiány |
| OrdinaryPhoenix |
AMD Ryzen 9700X |
RTX 5080 |
Prémium DDR5 tokozás |
$4 479.00 |
Eladva / Készlethiány |
Ezek a rendszerek jól illusztrálják, hogy a nyers számítási kapacitást, stabil szoftveres környezetet és maximális kompatibilitást igénylő területeken (3D renderelés, videóvágás, zenei produkció és lokális AI/ML modellezés) az x86 konfigurációk megkerülhetetlenek.
A kiemelten nagy számítási sűrűséget és hibatűrő stabilitást követelő vállalati környezetek, adatközpontok és virtualizációs csomópontok szintén x86-alapú szervermodellekre épülnek :
| Szerver / Munkaállomás modell | CPU Konfiguráció | GPU Támogatás | RAM és Háttértár kapacitás | Ár (CAD) |
|---|---|---|---|---|
| AMD AI-Ready Prebuilt Server |
AMD Ryzen 9 9950X3D |
NVIDIA RTX 5090 |
128GB DDR5, Gen 5 NVMe sávszélesség |
$10 449.00 |
| Intel AI-Ready Server PC |
Intel Xeon / Core Ultra |
NVIDIA RTX 5090 |
128GB DDR5, Gen 5 NVMe sávszélesség |
$10 349.00 |
| AMD AI-Ready Workstation PC |
AMD Ryzen |
NVIDIA RTX 5080 |
96GB DDR5 nagysebességű RAM |
$8 099.00 |
| AI-Ready Prebuilt Server |
AMD EPYC |
- |
128GB DDR4, szerver-szintű alaplap |
$7 449.00 |
| Enterprise Custom Rack Node |
AMD EPYC 9005 (192 mag) |
NVIDIA A100 Tensor Core / 3x A600 |
Max 2TB DDR5 ECC, 240TB NVMe RAID 6 |
Egyedi árazás |
A félvezetőgyártás nanotechnológiás csatamezeje: Intel 18A vs. TSMC N2
A félvezetőgyártás élvonala 2026-ban a sub-2-nanométeres tartományba lépett, ahol a TSMC N2 (2 nm-es osztályú) és az Intel 18A (1,8 nm-es osztályú) technológiája csap össze közvetlenül. A FinFET tranzisztorok elavulásával mindkét ökoszisztéma áttért a vízszintesen elhelyezett Gate-All-Around (GAA) csatorna-architektúrára, amelynél a kapuelektróda teljesen körülöleli a vezető csatornát, biztosítva a tökéletes elektrosztatikus kontrollt és a minimális szivárgási áramot.
Az Intel RibbonFET és a TSMC N2 GAA konstrukciói azonban alapvető technológiai és tervezési filozófiabeli eltéréseket mutatnak :
1. Csatorna-geometria és áramerősség-szabályozás (Drive-Strength Tuning)
-
Intel RibbonFET: Az Intel nanoribbon (nanoszalag) csatornákat alkalmaz, amelyek téglalap keresztmetszetű, vízszintesen egymásra pakolt félvezető testek. A RibbonFET legfőbb technológiai előnye a folyamatos szélesség-moduláció (continuous width modulation). Az EUV (szélsőséges ultraibolya) litográfia segítségével az Intel képes a tranzisztorok szalagszélességét folyamatosan változtatni a tervezés során. Ez lehetővé teszi a tranzisztor meghajtó áramerősségének precíz skálázását anélkül, hogy növelni kellene a függőlegesen egymásra helyezett szalagok számát, vagy külön olvasást segítő áramköröket kellene beépíteni.
-
TSMC N2 GAA: A TSMC nanolap (nanosheet) architektúrát használ, de a gyártási kockázatok csökkentése érdekében a lapok szélességét szigorúan korlátozza, hogy azok illeszkedjenek a korábbi FinFET rácselrendezéshez. A meghajtó áramerősség szabályozását nem a szélesség folyamatos változtatásával, hanem a csatornák darabszámának növelésével oldják meg.
2. PMOS kezelés és SRAM architektúra
-
Intel RibbonFET: Az Intel szimmetrikus módon mind az NMOS, mind a PMOS tranzisztoroknál teljes körű GAA struktúrát alkalmaz. Emellett az Intel teljesen 3D-s memória-architektúrát szabadalmaztatott, ahol az SRAM memóriacellákat függőlegesen egymásra pakolják a nanoribbon rétegek között, maximalizálva az adatsűrűséget.
-
TSMC N2 GAA: A TSMC egy hibrid, aszimmetrikus megközelítést választott a komplexitás csökkentésére. Az SRAM cellákban a PMOS felhúzó (pull-up) tranzisztoroknál megtartotta a régebbi FinFET struktúrát, és csak az NMOS lehúzó (pull-down) és passz-kapu (pass-gate) tranzisztoroknál vezette be a GAA nanolapokat. Ez korlátozza az SRAM cellák skálázhatóságát, de lényegesen magasabb gyártási kihozatalt (yield) biztosít a bevezetési fázisban.
3. Hátoldali tápellátási hálózatok (Backside Power Delivery Network - BSPDN)
-
Intel PowerVia: Az Intel 18A egyik legnagyobb fegyverténye a PowerVia technológia. A feszültségellátó hálózatot teljes egészében átköltöztették a szilíciumlapka hátoldalára, elválasztva azt a lapka elülső oldalán futó jeltovábbító fémvezetékektől. Ez drasztikusan lecsökkenti az ellenállást és az IR feszültségesést (IR drop), javítja a tranzisztorok cellakihasználtságát, és 4%-os ISO-áramteljesítmény-növekedést biztosít.
-
TSMC N2: A TSMC első generációs N2 csomópontja nem támogatja a hátoldali tápellátást; továbbra is a hagyományos elülső oldali PDN-re támaszkodik. A TSMC a BSPDN-t csak a későbbi N2P és 1.6 nm (A16) variánsoknál vezeti be.
4. Sűrűség és gyárthatóság
Bár az Intel technológiailag fejlettebb megoldásokat vonultat fel egyszerre (a RibbonFET és a PowerVia egyidejű bevezetése komoly mérnöki bravúr és kockázat), a TSMC sűrűségben megőrzi vezető szerepét. A TSMC N2 nagy sűrűségű (HD) standard cellái 313 millió tranzisztor elhelyezését teszik lehetővé négyzetmilliméterenként (313 MTr/mm2), míg az Intel 18A sűrűsége 238 MTr/mm2.
A TSMC N2 kapacitásai szinte teljesen ki vannak árusítva az olyan tech-óriásoknak, mint az Apple, az Nvidia és az AMD, miközben az Intel a saját Panther Lake (Core Ultra Series 3) és Clearwater Forest (288-magos Xeon 6+) processzoraival próbálja bizonyítani a 18A életképességét.
| Technikai paraméter | Intel 18A | TSMC N2 |
|---|---|---|
| Tranzisztor szerkezet |
RibbonFET GAA (Mindkét csatornán) |
Nanosheet GAA (Hibrid FinFET az SRAM-ban) |
| Tranzisztor sűrűség (HD) |
238 MTr/mm2 |
313 MTr/mm2 |
| Tápellátási technológia |
PowerVia BSPDN (Hátoldali) |
Hagyományos Frontside PDN (Elülső oldali) |
| Szélesség moduláció |
Folyamatos (EUV alapú, szélesség-hangolható) |
Diszkrét (Csatornaszám alapú) |
| CFET (Complementary) útmutató |
Fejlett szabadalmak (3T eDRAM Gain Cell, 50% területmegtakarítás) |
Post-N2 fázisra halasztva |
Multi-chiplet integráció és a 3.5D tokozás
Az AI modellek méretének növekedése megköveteli az egyetlen tokozáson belüli számítási sűrűség radikális fokozását, ami túllép a monolitikus chipek lehetőségein. Az Intel erre a kihívásra egy gigantikus, 10 296 mm2 területű multi-chiplet processzortervvel válaszolt, amely a heterogén 3.5D integráció technológiai csúcsa :
-
Számítási elemek (Compute Tiles): 16 darab, az ultra-fejlett Intel 14A (1,4 nm-es) csomóponton készülő compute csempe végzi a számításokat, amelyek második generációs RibbonFET tranzisztorokat és PowerDirect hátoldali tápellátást alkalmaznak a feszültségesés kiküszöbölésére.
-
Aktív hordozó lapkák (Active Base Dies): 8 darab, az Intel 18A-PT csomóponton gyártott aktív alap szilícium die helyezkedik el a számítási réteg alatt. Ezek nem passzív interpozerek, hanem hatalmas mennyiségű beágyazott SRAM memóriát és aktív útválasztó logikát tartalmaznak az ultra-alacsony késleltetésű magok közötti kommunikációhoz.
-
HBM5 memória-tornyok: 24 darab függőlegesen rétegelt HBM5 (High Bandwidth Memory 5) memóriastack veszi körül a magokat, biztosítva a több terabájtos másodpercenkénti adat-áteresztőképességet.
-
3.5D Tokozás: A gigantikus rendszert függőlegesen a Foveros Direct 3D tokozási technológia köti össze közvetlen réz-a-rézen csatlakozásokkal (9 μm alatti csatlakozási osztásközzel), míg horizontálisan az EMIB-T (Embedded Multi-die Interconnect Bridge) biztosítja az átjárást. Ez a felépítés közvetlenül fenyegeti a TSMC CoWoS (Chip on Wafer on Substrate) csomagolási egyeduralmát az AI piacon.
Neurális Feldolgozó Egységek (NPU) és az on-device mesterséges intelligencia
Az on-device (eszközön futó) mesterséges intelligencia robbanásszerű terjedése szükségessé tette egy teljesen új, dedikált hardveres koprocesszor, a Neurális Feldolgozó Egység (Neural Processing Unit - NPU) integrálását a modern CPU-kba. Az NPU feladata a gépi tanulási algoritmusok és neurális hálózatok alapját képező nagy tömegű mátrix-szorzási és konvolúciós műveletek hardveres gyorsítása.
Míg a CPU az általános programszálak és elágazások kezelésében erős, a GPU pedig a masszív párhuzamos lebegőpontos renderelésben, az NPU-t kifejezetten alacsony energiafogyasztású, tenzor-szorzó tömbökre optimalizált áramkörök alkotják. Az NPU alkalmazása 10–40-szer nagyobb energiahatékonyságot biztosít a CPU-hoz képest, és 44%-kal kevesebb energiát fogyaszt, mint a GPU, lehetővé téve a folyamatosan aktív (always-on) AI funkciók működtetését anélkül, hogy az akkumulátor gyorsan lemerülne.
A Microsoft Copilot+ specifikációja minimálisan 40 TOPS (Trillion Operations Per Second) NPU teljesítményt ír elő a helyi AI asszisztensek futtatásához. A 2026-os mobil- és asztali processzorok NPU implementációi komoly eltéréseket mutatnak architektúra és szoftveres támogatás terén :

1. Qualcomm Hexagon NPU 6 (Snapdragon X2 Elite / Extreme)
A Qualcomm 2026-os csúcsmobil- és laptoparchitektúrája eléri a megdöbbentő 80–85 TOPS dedikált NPU teljesítményt, amivel vezeti a piacot. A Hexagon NPU 6 egy 12 szálon futó, szálanként 4-széles VLIW (Very Long Instruction Word) skalár és vektor egységgel rendelkezik, amely 143%-os áteresztőképesség-növekedést mutat a korábbi generációkhoz képest. Szoftveres szinten a Qualcomm AI Engine Direct és a Windows AI szoftveres verem segítségével támogatja az agentic (ágens-alapú) AI terheléseket.
A Qualcomm elemzése szerint egyetlen, 14 milliárd paraméteres (14B) LLM ágens folyamatos futtatása 1024-es kontextushosszal önmagában 143 TOPS teljesítményt igényel, míg a több ágenst futtató multimodal (kép- és szövegalapú) feladatok stabilan legalább 72 TOPS kapacitást követelnek meg, amit a Hexagon NPU 6 képes kiszolgálni.
2. AMD XDNA 2 (Ryzen AI 400 sorozat)
Az AMD az NPU technológiáját a felvásárolt Xilinx adaptív architektúrájára alapozza. Az XDNA 2 térben elrendezett, dinamikusan programozható AI motor-csempékből (AI Engine tiles) áll össze, amelyek VLIW és SIMD vektoros magokat tartalmaznak. Az egység 60 TOPS dedikált teljesítményt nyújt. Az AMD nagy előnye az x86-os ökoszisztémával való zökkenőmentes kompatibilitás, valamint a rugalmas szoftveres programozhatóság a Ryzen AI SDK és a Vitis AI segítségével.
3. Intel NPU 4 (Lunar Lake / Core Ultra 200V sorozat)
Az Intel Lunar Lake processzorcsaládba ágyazott NPU 4 egység 48 TOPS teljesítményt nyújt. Az Intel architektúrájának egyedi jellemzője, hogy a versenytársakkal szemben (akik főleg a hatékonyabb INT8/FP8 formátumokra fókuszálnak) teljes körű, magas hatékonyságú hardveres támogatást biztosít a precízebb FP16 lebegőpontos számításokhoz is. Szoftveres téren az Intel az OpenVINO (Open Visual Inference and Neural Network Optimization) keretrendszerrel a piac legfejlettebb és legjobban dokumentált fejlesztői támogatását nyújtja.
4. Apple Neural Engine (M4 sorozat)
Az Apple M4, M4 Pro és M4 Max processzorokba épített 16-magos Neural Engine egységesen 38 TOPS elméleti teljesítményre képes. Bár a puszta TOPS érték elmarad a Qualcomm mögött, az Apple egy hatalmas architektúrális előnnyel rendelkezik: az egységes memóriával (Unified Memory), amely az M4 Max esetében eléri a megdöbbentő 546 GB/s sávszélességet és a 128 GB kapacitást. Ez lehetővé teszi, hogy az NPU másodpercek alatt töltsön be és futtasson lokálisan hatalmas méretű, akár 70 milliárd paraméteres (70B) LLM modelleket közvetlenül a rendszermemóriából, megkerülve az x86 PC-k korlátozott PCIe és szoftveres sávszélességi akadályait.
| NPU Építőelem | TOPS Kapacitás | Főbb előny | Támogatott Formátumok | Fejlesztői Keretrendszer |
|---|---|---|---|---|
| Qualcomm Hexagon 6 |
80–85 TOPS |
Legmagasabb nyers sebesség, alacsony fogyasztás |
FP16, FP8, BF16, INT8, INT2 |
Qualcomm AI Engine Direct, PyTorch, ONNX |
| AMD XDNA 2 |
60–80 TOPS |
Rugalmas, programozható AI motor csempék |
INT8, FP16, Block FP16 |
Ryzen AI SDK, Vitis AI, ONNX Runtime |
| Intel NPU 4 |
48 TOPS |
Kiváló FP16 támogatás és szoftveres ökoszisztéma |
FP16, INT8, INT4 |
OpenVINO, PyTorch, Hugging Face |
| Apple Neural Engine |
38 TOPS |
Ultra-magas sávszélességű egységes memória elérés |
FP16, INT8 |
CoreML, MLX (Apple Silicon optimalizált) |
Optikai számítástechnika és vékonyrétegű lítium-niobát processzorok
Mivel az elektronikus tranzisztorok fizikai skálázhatósága hőtani és elektromos határokba ütközik, a félvezetőipar elkezdett alternatív fizikai hordozók után kutatni. A legígéretesebb irányzat a fotonikus (vagy optikai) számítástechnika, amely elektromos áram helyett fényrészecskéket (fotonokat) használ az információ kódolására és feldolgozására.
A fotonok fénysebességgel terjednek, nem generálnak hőt a chipen belül, nincsenek kitéve elektromágneses interferenciának, és szinte végtelen sávszélességet tesznek lehetővé a hullámhossz-osztásos multiplexelés (WDM) révén.
Különösen kritikus ez a technológia az AI adatközpontok skálázásában. Az olyan elektronikus interconnect vonalak, mint az Nvidia NVLink és NVswitch rézkábelei, fizikai korlátokba ütköznek: hatótávolságuk mindössze egy méter, ami felett a jelcsillapodás és a késleltetés elfogadhatatlanná válik. Az AI modellek növekedésével azonban egész kabinet-sorokat kell összekapcsolni egyetlen koherens számítási tartományba, ami csak optikai interconnect vonalakkal és fotonikus processzorokkal valósítható meg.
Vékonyrétegű lítium-niobát szigetelőn (Thin-Film Lithium Niobate on Insulator - TFLNoI)
A fotonikus integrált áramkörök (Photonic Integrated Circuits - PIC) fizikai alapját a TFLNoI technológia képezi. A lítium-niobát (LiNbO3) egy trigonális kristályszerkezetű, ferroelektromos és kettőstörő anyag, amely kivételes elektro-optikai és nemlineáris optikai tulajdonságokkal rendelkezik. A TFLNoI platformon egy rendkívül vékony lítium-niobát réteget kötnek rá egy alacsony törésmutatójú szilícium-dioxid (SiO2) szubsztrátumra, amely egy szilícium hordozó ostyán helyezkedik el.
Ez a struktúra az alábbi áttörő előnyöket biztosítja a hagyományos CMOS és más optikai hordozóanyagokkal (mint az indium-foszfid vagy gallium-arzenid) szemben :
-
Rendkívül alacsony optikai veszteség: A TFLNoI hullámvezetők átviteli vesztesége mindössze 0,1 dB/cm (amely a tervek szerint 2027-re 0,05 dB/cm-re csökken), biztosítva a fényjelek minimális csillapodását.
-
Nagysebességű fénymoduláció hőtermelés nélkül: A lítium-niobát erős elektro-optikai (Pockels) effektussal rendelkezik. Amikor elektromos feszültséget kapcsolunk a kristályra, azonnal megváltozik annak törésmutatója. Ez lehetővé teszi a fény fázisának és intenzitásának ultra-gyors, GHz-es tartományú modulációját. Mivel ez tisztán elektromos terekkel történik, nem generálódik hő a chip felületén, megszüntetve a különböző optikai komponensek közötti termikus áthallást (thermal crosstalk).
-
Fotonikus interferométer hálózatok: A magas törésmutató-különbség (high index contrast) lehetővé teszi a hullámvezetők szélességének 400 nm-re, a kanyarodási sugarak 50 μm-re csökkentését, drasztikusan minimalizálva a fotonikus chip méretét.
A lítium-niobát kivételes tulajdonságait jól mutatja a többi félvezető- és optikai hordozóanyaggal történő összehasonlítás :
| Anyag megnevezése | Elektro-optikai együttható (r33 / r41) (pm/V) | Törésmutató értéke |
|---|---|---|
| Lítium-niobát (LiNbO3) |
31 (r33) |
~2,2 |
| Indium-foszfid (InP) |
1,45 |
~3,17 |
| Gallium-arzenid (GaAs) |
1,6 (r41) |
~3,3 |
| Kadmium-tellurid (CdTe) |
6,8 (r41) |
~2,7 |
| Szilícium (Si) |
Elhanyagolható |
~3,5 |
| Szilícium-nitrid (Si3N4) |
Elhanyagolható |
~2,0 |
Matematikai műveletek végrehajtása fényinterferenciával
Míg az elektronikus processzorokban egy egyszerű matematikai művelet elvégzése is több száz tranzisztor összehangolt kapcsolását és több órajelciklust igényel, addig a fotonikus processzorokban a matematika natív módon, fizikai törvényszerűségek alapján, a fényhullámok egymásra hatásával (interferenciájával) történik meg.
A Mach-Zehnder interferométerek és a nemlineáris optikai elemek segítségével az alapvető matematikai operációk közvetlenül a hullámvezetőben hajtódnak végre :
-
Összeadás és kivonás: Két fényhullám összeeresztésével a konstruktív vagy destruktív interferencia révén az amplitúdók natív módon összeadódnak vagy kivonódnak, egyetlen γ optikai elem segítségével, míg a CMOS-nak ehhez közel 200 tranzisztorra van szüksége.
-
Fourier-transzformáció: Diffraktív optikai rácsok vagy mikrolencsék segítségével a fény natív módon hajtja végre a Fourier-transzformációt a terjedése során, megkerülve a CMOS architektúrák több millió tranzisztort igénylő Fast Fourier Transform (FFT) áramköreit.
Ennek eredményeképpen a fotonikus processzorok akár 30-szoros energiahatékonysági előnyt mutatnak a CMOS-alapú chipekkel szemben: egy 8 bites TFLN optikai művelet energiaigénye mindössze 76 fJ (femtojoule), míg egy ekvivalens 8 bites CMOS processzor művelete 2300 fJ energiát emészt fel.
Eoptikai=76 fJ≪ECMOS=2300 fJ
A fotonikus integrált áramkörök belső komplexitását és fizikai jellemzőit jól szemlélteti a Q.ANT LNOI platform interferométer-specifikációja :
| Specifikáció | 4 Független Optikai Módus | 8 Független Optikai Módus |
|---|---|---|
| Platform |
Lítium-niobát szigetelőn (LNOI) |
Lítium-niobát szigetelőn (LNOI) |
| Lapkameret (Die Size) |
3,6×7 mm2 |
8,5×25,6 mm2 |
| Működési hullámhossz |
1550 nm |
1550 nm |
| Hangolható elemek száma |
24 |
112 |
| Integrált optikai elemek |
>50 |
>400 |
| Elektromos vezérlés |
Pockels elektro-optikai hatás |
Pockels elektro-optikai hatás |
| Modulátor fogyasztás |
<5 mW @ 1 MHz |
<5 mW @ 1 MHz |
| Elektromos csatlakozás |
Planáris, egyrétegű |
Többrétegű |
Kereskedelmi integráció: Q.ANT Native Processing Server (NPS 2)
A fotonikus technológia kilépett a laboratóriumokból; a Q.ANT NPS 2 az első kereskedelmi forgalomban elérhető analóg fotonikus processzor, amelyet kifejezetten nemlineáris mesterséges intelligencia és HPC (High-Performance Computing) terhelések gyorsítására terveztek. Az NPS 2 egy standard 19 colos, 4U magas szerverházba illeszkedik, és Linux (Debian/Ubuntu) operációs rendszer alatt fut.
A Native Processing Unit (NPU) egy kétslotos PCIe Gen4 x8 kártyaként csatlakozik az x86-os hoszt processzorhoz. Az ultrafast fotonikus mag z-vágatú (z-cut) lítium-niobáton alapul, és 8 GOPS (Giga Operations Per Second) átmenő teljesítményt nyújt mindössze 150 W-os kártyaszintű fogyasztás mellett, miközben maga a chip nem termel hőt. A szoftveres integrációt a Q.PAL (Photonic Algorithms Library) szoftverkönyvtár biztosítja, amely C/C++ és Python API-kon keresztül közvetlenül képes PyTorch alapú neurális hálózati rétegek optikai gyorsítására.
A precíz fizikai és rendszerszintű paramétereket az NPS 2 hivatalos műszaki adatlapja tartalmazza :
| Rendszerszintű paraméter | Érték / Megnevezés |
|---|---|
| Szerver formátum |
19'' rack, 4U magasság (178×482×595 mm) |
| Rendszer architektúra |
x86 processzor; kártyás NPU bővíthetőség támogatása |
| Operációs rendszer |
Linux Debian / Ubuntu LTS |
| Hálózati interfész |
2x 10 Gbit Ethernet, 1x 1 Gbit szerviz, opcionális InfiniBand |
| Szoftveres interfész |
C / C++, Python API, PyTorch integráció |
| NPU formátum |
Teljes hosszúságú PCIe Gen4 x8 kártya (kétslotos magasság) |
| Fotonikus mag |
Ultrafast z-vágatú Lítium-niobát integrált áramkör |
| NPU áteresztőképesség |
8 GOPS (Giga Operations Per Second) |
| Tápellátás |
1600 W tápegység; AC 115-240 V (50-60 Hz) |
| NPU kártya fogyasztása |
150 W |
| Működési hőmérséklet |
15–35 ∘C |
| Súly |
NPS ház (kártyák nélkül): 23,8 kg; NPU kártya: 2,38 kg |
Összegzés és jövőbeli architektúrális kilátások
A modern mikroprocesszorok és CPU-k fejlődése 2026-ra elérte azt a pontot, ahol a puszta monolitikus szilícium-skálázás már nem képes kiszolgálni a piac exponenciálisan növekvő számítási igényeit. Az iparág válaszként egy mély architektúrális paradigmaváltáson megy keresztül, amely három pillérre épül:
-
Heterogén 3D integráció és chiplet-tervezés: A monolitikus chipek helyét átveszik a különböző gyártástechnológiákkal készülő, függőlegesen és horizontálisan összekapcsolt chiplet-rendszerek (mint az Intel 3.5D tokozása). Ez lehetővé teszi a retiklum-limitek áttörését és a speciális feladatokra optimalizált csomópontok (pl. 1,4 nm-es számítási magok és aktív SRAM alaplapok) egyetlen tokba integrálását.
-
Specializált AI koprocesszorok (NPU-k): Az on-device mesterséges intelligencia követelményei miatt az NPU-k a CPU-k elengedhetetlen részévé váltak. A Qualcomm Hexagon 6-hoz hasonló, rendkívül magas TOPS teljesítményű és alacsony bitmélységű architektúrák átveszik a neurális hálózatok futtatásának terhét a CPU-tól, drasztikusan csökkentve az eszközök energiafogyasztását.
-
Optikai és fotonikus számítástechnika térnyerése: A szilícium fizikai határainak átlépésére a vékonyrétegű lítium-niobát (TFLNoI) alapú fotonikus társprocesszorok jelentik a legígéretesebb alternatívát. Az NPS 2-höz hasonló kereskedelmi rendszerek bizonyítják, hogy az analóg optikai számítástechnika képes a bonyolult nemlineáris egyenletek fénysebességgel történő megoldására, minimalizálva az adatközpontok hűtési és áramellátási komplexitását.
A jövő asztali és vállalati számítógépei nem tisztán általános célú processzorokból fognak állni. Sokkal inkább olyan hibrid rendszerekké válnak, amelyekben az x86 vagy ARM CPU végzi az operációs rendszer és a szekvenciális vezérlési szálak koordinálását , a dedikált NPU kezeli a helyi, alacsony késleltetésű mesterséges intelligencia funkciókat , míg az integrált fotonikus koprocesszorok végzik a gigantikus méretű tudományos és gépi tanulási mátrix-számításokat közvetlenül a fény fizikai tulajdonságait kihasználva.