Hogyan válhatsz te is profi fotóssá a Honor 10 mesterséges intelligenciájával?
A fényképezés művészete megörökíti, és gyönyörű képekké alakítja a fényt. Egy-egy jelenet fénye ellenőrizetlenül éri el a kamera lencséjét. A lencsék, a szűrők, a média (film vagy szenzor) és a világítás megfelelő ismerete révén azonban a művész „megszelídítheti” ezt a fényt, és lélegzetelállító fotókat készíthet a kamera beállításainak módosításával és a legmegfelelőbb szűrők hozzáadásával. A fotósok gyakran specializálódnak egy-egy témára, mint például a portré, különböző termékek, tájképek, építészet, divat. A fényképezés egyetlen aspektusának megismerése több éven át tart, gyakran akár egy életen át. Ma már a mesterséges intelligencia (AI) segíthet, hogy az amatőr fotósok is elképesztő képeket tudjanak készíteni.
„Régebben csak úgy válhatott bárkiből is fotós, hogy az rengeteg, sokszor fájdalmas tanulással, lemondással járt. Most ehhez csak bátorság, nagy adag elszántság és egy megfelelő kamerás mobiltelefon kell. Beléptünk az úgynevezett influencerek korába, amikor a hétköznapi, egyszerűbb emberek is akár milliós rajongótáborra tehetnek szert – és ez nemcsak az Instagram toplistáján lévő Kardashian családot jelenti. A kamerás mobiltelefonok megjelenésével hirtelen millió fotós lépett elő a semmiből, és a számuk napról napra nő.” – mondja Kánai András, jövőkutató.
A szemantikus képszegmentáció [1] tudja mi van a képen
Képzeljük csak el, hogy egy csoportos szelfit készítünk egy csodálatos táj előtt. Azt szeretnénk, ha a fotó mindkét része jól sikerülne. Ha a háttér kevésbé tűnik érdekesnek, talán a Bokeh (a háttér elmosódása) javíthat a fotón. De Bokeh alkalmazása esetén a kamerának ügyelnie kell arra, hogy a csoport minden tagja fókuszban legyen, még akkor is, ha valaki kicsit hátrébb áll.
A szemantikus képszegmentáció olyan technika, amelynek célja, hogy minden egyes képpontról felismerje, mihez is tartozik (út, emberek, fák...). Ma a legtöbb AI kamera kétféle helyzetben alkalmazza a képszegmentációt. Egyrészt megkülönbözteti a hátteret az előtérben elhelyezkedő tárgytól. Másrészt felismeri a “jelenet típusát” (természet, virágok, étel...), hogy speciális módra vagy beállításra váltson. A Honor kamerája túllép ezen, és a szemantikus képszegmentáció használatával az információk hierarchiáját hozza létre, amelyek pontosabb, részletesebb beállításokat tesznek lehetővé. A fotózás és a beállítás is valós időben történik a neurális processzor, az NPU segítségével.
Amikor a szépségedet kell kihangsúlyozni
Egy másik példa arra, hogy hogyan használja a Honor kamerája a mesterséges intelligenciát: élénkíti az arcvonásokat, legyen szó bármilyen megvilágításról. Ha a naplementében szeretnél szelfit készíteni, a kamera egy korábbi generációs AI-ja egyszerűen átváltana „naplemente üzemmódra”. De miközben ez egy jó színbeállítást biztosítana a naplemente megörökítésére, a fotózandó arc homályos maradna. Ha a kamera szelfi beállításba kapcsol, a naplemente nem biztos, hogy optimálisan látszódik. A szemantikus képszegmentációval az AI felismeri, hogy két téma van a fotón és különállóként kezeli ezeket, hogy a lehető legjobb képet készítse.
A Honor kamerája fel tudja mérni az arc pontos, 3D-s [2] kontúrját és felismeri az olyan kulcsfontosságú részeket, mint például az orr, az arccsont és más, fontos arcvonások, amelyek leginkább egyedivé teszik valaki külsejét. Ezáltal a fényképezőgép gondoskodik arról, hogy az arc egyes részei élesek maradjanak, miközben más vonások kihangsúlyozzák a részleteket és a bőr természetes szépségét. Ez egy jelentős előrelépés a korábbi szelfijavító megoldásokhoz képest, amelyek gyakran természetellenes hatású képeket készítettek.
Talán a mobil portréfotózás egyik legjelentősebb előrelépése az olyan "portré" megvilágítás használata, amely fotóstúdióhoz hasonló fényforrást és reflektort idéz. Ez úgy működik, hogy az AI 2D fotó alapján megpróbálja felépíteni annak 3D reprezentációját. 3D kamera hiányában ezt a feladatot különlegesen nehéznek ítélték a szakemberek [3], de a Honor 10 NPU-ja megoldja ezt is, ráadásul hatékonyan.
„A professzionális és az amatőr közötti határ lassan elmosódik. Néhány évvel ezelőtt egy olyan reklámot láthattak a Super Bowl nézői, amelyet nem egy erre szakosodott reklámügynökség, hanem egy hétköznapi ember készített. A helyzet hasonlónak tűnik a fotózás világában is: minél jobb a mobiltelefonok kamerájának teljesítménye, az emberek annál professzionálisabb célokra használják.” – mondja Kánai.
A Honor innovációi az AI fotózásban
Nem sok olyan gyártó van, mint a Honor vagy a Google, amely sorozatgyártott készülékeiben használ olyan technikákat, mint a képszegmentálás. Azonban a képszegementáció csak egy alap, amelyre épít a Honor innovációja. A kép különböző funkcióinak felismerése csupán egy dolog, de a Honor mérnökei ezt az információt arra is felhasználják, hogy valós időben finomhangolható, komplex kamerát alkossanak, sajátos módszertan alkalmazásával.
Az AI fotózás a mesterséges intelligenciára épülő feladatok közül az egyik legnagyobb számítási igénnyel járó feladat. Ezért a Honor készülék dedikált neurális processzort (NPU) használ, amely ezeket a feladatokat átvállalja az általános CPU-tól. Bár ezek a feladatok futhatnának a CPU-n is, az a használhatóság és az energiafogyasztás rovására menne.
A digitális fotózás és a mesterséges intelligencia nagyban hozzájárul ahhoz is, hogy mi történik, miután a fotó már elkészült: retusálás, szerkesztés, animálás. Például elképzelhető, hogy egy csoportkép elkészítéséhez több fotó készül, majd az AI összeállít egy végső fotót, kiválasztva mindenki legjobb mosolyát. Az is lehetséges, hogy egy tömegben készült képről az AI retusálja a felesleges embereket és részleteket. [4] Valójában a mesterséges intelligencia már ma is segít a professzionális tervezőknek a képszerkesztésben.
A profi fotósok gyönyörű képeket készítenek, és többek között ezért is kattintanak olyan sokat. Az összes elkészített képet át kell nézni, kiválasztani, majd szerkeszteni. A fotós készségeken túl, a mesterséges intelligenciának köszönhetően rengeteg időt megspórolható. A profi és az amatőr fotósok között valójában az időfaktor az egyik különbség.
A mesterséges intelligencia segítségével a számítógép fotók ezreit nézheti és válogathatja át, mégpedig sokezerszer gyorsabban, mint azt egy ember tenné. Ha már megvannak a kívánt képek, az AI szerkeszti is ezeket, közel professzionális szinten. Ezek a megoldások jelenleg fejlesztés alatt állnak, ígéretes eredményekkel. [5]
„A jövő azoknak kedvez, akik a mesterséges intelligenciákkal való közös munkára egyfajta kentaurlétként tekintenek: az ember a főnök, ő irányít (a kentaur feje és keze), míg a mesterséges intelligencia jelenti a kentaur lábait. Az emberek így a jövőben sokkal jobban koncentrálhatnak majd olyan emberi erősségekre, mint például a kreativitás, mert a mesterséges intelligenciák már ma is “dolgozó osztályként” segítenek átértelmezni a napi lélekölő munka fogalmát. A MI használatával a felhasználók rövidebb idő alatt elsajátíthatják a jó fotózás alapjait. Itt is minden a digitális technológia használatáról, előnyeiről szól: a praktikusságról, a használhatóságról és a könnyebb élet ígéretéről.” – foglalja össze Kánai.
A futurista előrejelzései:
• Mivel a közösségi médiában elsősorban az interakciók száma határozza meg, hogy mennyi követője van valakinek, a mobiltelefonokban működő MI-k folyamatosan frissíteni fogják a kamerák funkcióit és jellemzőit. Például a MI megtanulhatja, hogy melyik fotó ért el nagyobb interakciót, és azután a következő képeket is képes lesz magától a már sikeresebbekhez alakítani.
• Ha a jövőben az okostelefonok fotókat tartalmazó felhőszolgáltatásokhoz is kapcsolódni fognak, megtanulják, hogy melyik fotó a sikeresebb és miért.
• Ha a Black Mirror sorozat szcenáriójában gondolkodunk, akkor olyan megoldás képe rémlik fel, ahol a szülők beállíthatják, hogy gyerekük egy bizonyos, veszélyes élethelyzetet jelentő fotót ne készítsen el. Ha már a beállítás is veszélyes (mert például öngyilkosság vagy baleset gyanúja merül fel), akkor a telefon megtagadja majd az ilyen képek elkészítését. Végeredményben a kamera egyfajta megelőző eszközként is szolgál, túlmutatva eredeti funkcióján.
• Az arcfelismerő rendszerek – más biometriai lehetőségekkel együtt használva – még biztonságosabbá teszik az okostelefonokat.
• A fotómanipulációval foglalkozó mobilalkalmazások piaca robbanás előtt áll. Először asztali gépeken terjedtek el, majd következtek a laptopok, és logikusan most a mobiltelefonos platformokon van a sor.
• Az augmented reality a következő nagy durranás. Képzeljünk el egy fotót, amelyen már készítés közben is látjuk az információkat a képen szereplő emberekről, állatokról vagy fotókról. Később így sokkal könnyebb lesz az így készült képek részleteit felismerni. Ennek például a bűnüldözésben lehet nagyobb szerepe.
A Honor-ról
A Honor a Huawei Csoporthoz tartozó vezető okostelefon e-brand. Szlogenje, "For the Brave", azaz "A bátraknak" értelmében a brandet arra teremtették, hogy a digitális bennszülöttek igényeinek megfelelő, internetre optimalizált termékekkel első osztályú felhasználói élményt nyújtson, cselekvésre inspiráljon, ösztönözze a kreativitást és támogassa a fiatalokat, hogy elérjék álmaikat. Ennek szellemében a Honor maga is bizonyítja bátorságát azzal, hogy meri másképp csinálni a dolgokat és megtenni a szükséges lépéseket, hogy elhozza ügyfeleinek a legújabb technológiákat és újításokat.
Kánai András – jövőkutató
A spekulatív fikcióval foglalkozó legnagyobb magyar nyelvű weboldal, az SFmag egyik alapítója, emellett kilenc science fiction elbeszélése jelent meg. 2014-től a Vodafone Magyarország integrált kommunikációs szakértője, 2016-ban pedig belső kommunikációs szakértője lett. Az elmúlt években egyetemeken, cégek számára, konferenciákon tart előadásokat science fiction és jövőkutatás témákban.
További információ: www.hihonor.com vagy kövessen minket:
https://www.facebook.com/honorglobal
https://twitter.com/Honorglobal
https://www.instagram.com/honorglobal
https://www.youtube.com/honorglobal
[1] Semantic Image Segmentation overview by Qure.ai