Egy neurális architektúrán alapuló új mikroprocesszor válthatja az energiaéhes grafikus kártyákat, és elhozhatja a helyi intelligens funkciókat, például az önvezetést.
Hatalmas ugrást jelenthet a mesterséges intelligencia számára az IBM San José-i mérnökei által kifejlesztett chip, a NorthPole. A chip felépítését az emberi agy ihlette, és számítási teljesítménye minden tesztben magasan veri a piacon jelenleg elérhető hardvereket. A NorthPole azonban nem emiatt forradalmi, hanem mert rettentően hatékony: 96 százalékkal kevesebb energiát igényel. Ez pedig nagyon jelentős előrelépés, ha tudjuk, hogy a kortárs mesterséges intelligenciaként ismert nyelvi modellek szédületesen energiaéhesek. A ChatGPT például a Washingtoni Egyetem kutatói szerint 1 gigawattórát fogyaszt naponta. A természetes intelligencia által használt hardver, az agy ehhez képest nagyon energiatakarékos.
A probléma egyik oka, hogy a mesterséges intelligenciák jelenleg grafikus processzorok tízezreiből épített adatközpontokon futnak. Az elmúlt években a kriptobányászattal párhuzamosan pörgő videokártyák piacát az Nvidia vezeti. A céget az MI-láz idén nyáron repítette az ezermilliárd dollár feletti piaci értékű cégek klubjába, a Google, a Microsoft és az Apple mellé (a Meta és a tajvani chipgyártó a TSMC fölé). A grafikus processzorok ugyanakkor számítási ciklusonként 10-15-ször annyi energiát fogyasztanak, mint egy CPU – a probléma tehát nem pusztán a költségekről és az energetikai infrastruktúrákról, hanem a technikai fejlődésről szól.
Az IBM nem most kezdte az emberi agy ihlette chipek tervezését. Korábbi chipjeik, a TrueNorth és a SpiNNaker egy évtizedes munka állomásai.
A technikai kihívás lényege, hogy az agy analóg, a számítógép pedig digitális. Léteznek analóg számítógépek és chipek is, leginkább ezek alkalmasak az agy működésének hatékony utánzására, de megvannak a saját korlátaik, például a zajszűrés terén.
A TrueNorth egy 2014-ben bemutatott analóg chip volt, amelyben különleges anyagok alkalmazásával oldották meg, hogy a számítás és a memória egy helyen történjen. Négy nagyságrenddel energiahatékonyabb volt, mint a kortárs mikroprocesszorok. A NorthPole nem analóg, de benne vannak a TrueNorth fejlesztése során szerzett tapasztalatok.
A NorthPole-ban 22 milliárd tranzisztor található 256 magban, amelyek az agyban dolgozó idegsejtekhez hasonlóan osztják el egymás között a feladatokat, és igazából itt nem a tranzisztorok jelentik az igazi újítást, hanem a neurálisháló-alapú feladatmegosztás, ami az UCLA kutatóinak, Subramanian Iyernek és Vwani Roychowdhurynek agyi információfeldolgozást leíró elméletei munkáján alapul (Iyernek és Roychowdhurynek a tudományos alapkutatáson kívül nem volt köze az IBM fejlesztéséhez). A magok saját memóriájukkal helyben oldanak meg feladatokat, de közben hozzáférhetnek a központi memóriához is.
Végeredményben a NorthPole négyszer annyi tranzisztorral 640-szer akkora MI-modellt képes futtatni, és háromezerszer annyi számítást tud elvégezni, mint a 2014-ben bemutatott TrueNorth. Versenyhelyzetben az Nvidia V100 GPU-val összevetve az IBM chip huszonkétszer gyorsabb és huszonötször energiahatékonyabb volt, ötödakkora alapterületen.
A Moore-törvény szerint az integrált áramkörre épülő tranzisztorok száma kétévente megduplázódik. Ez az elv közismerten egy évtizede a végét járja a különböző fizikai akadályok miatt. A NorthPole által képviselt megoldásban még sok technikai tartalék van. Az előrejelzések szerint a következő generációkban kétmilliárd tranzisztor kerülhet egyetlen négyzetmilliméterre – egy ilyen chip már önmagában képes lesz nagyobb algoritmusokat futtatni, de ez már nem pusztán a tranzisztorok számán múlik.
Az architektúra üti a Moore-törvényt
– írta erről a fejlesztőcsapat.
A hatékonyabb MI-chipek elterjedésével megerősödik a pereminformatikának nevezett technikai trend. A jelen ügymenet szerint az eszközeink által használt funkciók egy jelentős része mobilinterneten és száloptikán, a felhőn, szerverfarmok beiktatásával valósul meg. A pereminformatika előretörésével a problémák egyre nagyobb része helyben oldódik meg, ami gyorsabb és energiatakarékosabb.
A gyakorlatban ez azt jelenti, hogy a hardver helyben végzi a nyelvfelismerést, az arcfelismerést, és döntő előrelépést jelent az önvezető autóknál.
(IEEE Spectrum, Nature, SingularityHub, Yahoo! Finance)