Szájról olvasni tanul a Google

Legfrissebb hírek

Kényelmes, de pazarló is egyben a vezeték nélküli töltés

A vezeték nélküli töltés kényelmes és ma már kellően gyors is – de az árammal elég pazarlóan bánik.

2026. június 24., 18:17

A Google még mindig a legnagyobb kereső – de vajon a legjobb is?

A felhasználók szerint ez már korántsem biztos, a mesterséges intelligencia és a Reddit is beelőzhetett.

2026. június 24., 17:00

Ismét kínai a legerősebb szuperszámítógép

Hosszú ideig Amerika volt az első helyen (utoljára az El Capitannal), a LineShine viszont újra Kínába vitte a képzeletbeli serleget.

2026. június 24., 15:30

Már a tartalomgyártók is aggódnak az AI miatt

A felhasználók egyre tudatosabban nézik, hogy AI készítette-e a szöveget, és ha igen, azt nem díjazzák.

2026. június 24., 14:00

Acer Veriton RA110 AI: mesterséges intelligencia helyben

Az Acertől érkezett a bizonyíték arra, hogy 160×160×47 mm-ben is rengeteg AI számítási kapacitás fér el.

2026. június 6., 18:00

Tovább a hírekhez

A Google folyamatosan fejleszti szolgáltatásait, a digitális személyi asszisztenseknél azonban belefutott egy érdekes problémába: a beszédfelismerés nagyon jól működik akkor, ha csak a beszélő hangját hallani, illetve háttérzajokat, viszont a szoftver gondban van akkor, ha egyszerre többen is beszélnek. Márpedig ilyen elég gyakran előfordul. Ez persze nem véletlen: a Google algoritmusa a gépi tanulás révén több (tíz)ezer féle hangmintát ismer fel, és ezeket nagyon hatékonyan ki tudja szűrni egy hangfelvételről, azonban ez a módszer arra nem alkalmas, hogy több beszélő hangját el lehessen különíteni egymástól.

A fejlesztők ezért egy másik megoldást választottak: készítettek egy olyan algoritmust, amely a beszélők arcát, elsősorban a szájmozgást figyeli, és az így szerzett extra információkat használja fel ahhoz, hogy a hangfelvételen szereplők beszélgetéseit külön-külön rögzítse.

Egyelőre nem tudni, hogy a Google pontosan mihez szeretne kezdeni a technológiával; az biztos, hogy a megoldás a digitális személyi asszisztensek működését pontosítani tudja, de könnyen elképzelhető a felhasználása orvosi területen is. Javítható vele továbbá az automatikus feliratkészítő rendszerek hatékonysága is, amelyek eléggé küszködnek akkor, ha egyszerre többen is beszélnek. Egyelőre a lehetőségek értékelése folyik; de annyi azért biztos, hogy a Google először a saját szolgáltatásait szeretné majd felturbózni az újdonsággal.