Napi AI hírek

2026. február 19.

14 cikk • v0.5.1

Kiemelt cikk

7.6 pont

Nagyszabású nyelvi modellek alapú ügynökrendszerek klinikai döntéstámogatási feladatokhoz

Nature febr. 19.

A legújabb kutatás a nagyszabású nyelvi modellek (LLM) alapú ügynökrendszerek teljesítményének szisztematikus értékelésére összpontosít, különös figyelmet fordítva a klinikai döntéstámogatási feladatokra. Az OpenManus és a Manus rendszerek összehasonlítása fontos tanulságokat nyújt a klinikai alkalmazásokra vonatkozóan. Az OpenManus, amely az OpenAI Llama-4 modelljén alapul, orvosi területen testreszabott ügynökökkel bővítve, míg a Manus egy szabadalmaztatott rendszer, amely egy többlépcsős tervező-végrehajtó-ellenőrző architektúrát alkalmaz. A kutatás során a rendszereket három benchmark tesztcsoportra vonatkozóan értékelték, amelyek a diagnosztikai szimulációk és a tudásintenzív orvosi QA feladatok köré összpontosítanak.

Az eredmények azt mutatják, hogy bár az ügynökrendszerek hozzáférnek fejlett eszközökhöz, mint például webes böngészés és szövegfájl-szerkesztés, a teljesítményük nem volt jelentősen jobb a hagyományos LLM-ekhez képest. A diagnosztikai szimulációnál az ügynökrendszerek csupán 60,3%-os pontosságot értek el, míg más teszteken, mint például a MedAgentsBench, a teljesítmény még alacsonyabb volt. A multimodális feladatoknál a pontosság mindössze 15,5%-os eredményt mutatott, ami arra utal, hogy a jelenlegi ügynöki tervezések nem felelnek meg a klinikai igényeknek.

Ez a kutatás világosan rámutat arra, hogy a klinikai döntéstámogatás terén a jelenlegi ügynökrendszerek nem nyújtanak elegendő teljesítményjavulást ahhoz, hogy komolyabban mérlegeljék a bevezetésüket. A költségek és a számítási igények, amelyek a rendszerek működtetésével járnak, jelentősen megnövekedtek, ami azt jelenti, hogy a jövőbeni fejlesztéseknek sürgősen a hatékonyság és a pontosság javítására kell összpontosítaniuk, hogy klinikailag alkalmazható megoldások születhessenek.

További hírek

7.2

OpenClaw új igényeket generál az AI iránt, az Nvidia GPU árak megugranak

Business Insider febr. 19. 12:51 Angol

Az AI iránti kereslet az utóbbi hetekben megugrott, különösen az OpenClaw ügynökrendszer terjedésének köszönhetően, ami az Nvidia GPU árak növekedését is eredményezte.

6.7

A Reliance bejelenti 110 milliárd dolláros AI befektetési tervét, India technológiai ambíciói fokozódnak

TechCrunch febr. 19. 11:39 Angol

A Reliance csoport 110 milliárd dolláros befektetési tervet jelentett be, amely célja AI számítási infrastruktúra kiépítése Indiában a következő hét évben.

6.6

Az Admanager elindítja a Site LLM-t – Egy privát AI, amely segíti az egészségügyi kiadókat

Prnewswire febr. 19. 12:50 Angol

Az Admanager bemutatta a Site LLM-t, amely egy privát AI asszisztens az egészségügyi kiadók számára, célja, hogy visszaállítsa az olvasói elköteleződést az AI eszközök térnyerésével szemben.

6.5

IBM Bob: Az LLM kódellenőrzés új korszakát hozza el

Ibm febr. 19. 12:50 Angol

Az IBM Bob egy generatív AI-alapú IDE, amely automatizálja a kódellenőrzési folyamatokat, lehetővé téve a fejlesztők számára, hogy a fejlesztés magasabb szintű tervezési döntéseire összpontosítsanak.

5.9

Claude Cowork és az IT szolgáltatások: Strukturális zavar vagy túlzott AI szorongás?

Everest Group Reports febr. 19. 12:50 Angol

Claude Cowork új lehetőségeket teremt az IT szolgáltatásokban, mivel a plugin-alapú modell lehetővé teszi a feladatok hatékonyabb kezelését, de a valódi hatása még nem bizonyított.

5.8

OpenAI mélyíti indiai terjeszkedését a Pine Labs fintech partnerséggel

TechCrunch febr. 19. 03:30 Angol

Az OpenAI partnerséget kötött a Pine Labs-szal, hogy AI-alapú megoldásokat integráljon a pénzügyi tranzakciók automatizálására Indiában.

5.8

A marketingszakemberek növelik költségvetésüket, ahogy az LLM-ek felbukkannak

CMOtech US febr. 19. 12:50 Angol

A tartalommarketing költségvetése várhatóan nőni fog 2026-ban, mivel a marketingcsapatok egyre inkább az LLM-eket tekintik a közönségük kulcsfontosságú részének.

5.7

A legjobb AI Python kódoláshoz: 7 eszköz a termelékenység növelésére

Skillify Solutions Blogs: Future-Ready Skills for a Fast-Changing AI World febr. 19. 12:50 Angol

Az új AI kódolási asszisztensek segíthetnek a Python fejlesztőknek a termelékenységük növelésében, de a valódi teljesítmény és hatékonyság kulcsfontosságú az eszközök kiválasztásakor.

5.4

Az LLM által generált jelszavak 'alapvetően gyengék', figyelmeztetnek a szakértők

Theregister febr. 19. 12:50 Angol

A generatív AI eszközök, mint a Claude, ChatGPT és Gemini, meglepően gyenge jelszavakat generálnak, amelyek könnyen kitalálhatók, rámutatva a biztonsági kockázatokra.

5.3

Elkerülve az újra-bevezetési adót

by Rick Guetter febr. 19. 12:50 Angol

Az AI chat-történetek rendszerezése nehézségekbe ütközik, de a Projektek funkciók segíthetnek a folyamatok szervezésében és az ismételt bevezetési idő csökkentésében.

5.2

Elindult a Google Cloud VP-je, mit tegyen a startupokkal?

TechCrunch febr. 18. 21:07 Angol

A startup alapítóknak gyorsan kell reagálniuk a piaci kihívásokra, miközben az AI-t használják a finanszírozási és infrastrukturális költségek növekedésével szemben.

5.0

Kutatók hat új OpenClaw sebezhetőséget tártak fel

Infosecurity Magazine febr. 19. 12:51 Angol

Az OpenClaw népszerű ügynöki AI asszisztens hat új sebezhetőségét javították ki, amelyek a biztonsági kockázatokat növelik az alkalmazás működése során.

4.7

Az Apple Mac Mini népszerűsége nő az OpenClaw őrület miatt

Business Insider febr. 19. 12:51 Angol

A Mac Mini iránti kereslet megugrása figyelhető meg, mivel az OpenClaw ügynöki AI iránti érdeklődés felerősödik.