Mitä on ReALM?

ReALM tarkoittaa “Viittauksen ratkaiseminen kielen mallintamisena”, ja se on Apple-tutkijoiden kehittämä mullistava ratkaisu. Se on siis uusi kielimalli (Large Language Model, LLM), joka käsittelee viittauksen tunnistamisen ongelmaa kielen mallintamisen tehtävänä.

ReALM muuntaa tehokkaasti erilaisia konteksteja tekstuaaliseksi esitykseksi, jota se sitten käsittelee osana kielitehtävää. Tämä voi sisältää:

  • keskustelut – kuten tekstiviestit, äänikomentot avustajalle tai sähköpostit,
  • näytön elementit – esimerkiksi valokuvat, kalenteri, säätiedotussovellus tai taustalla toimivat sovellukset ja prosessit.

Mikä tekee ReALM:ista erilaisen kuin muut viittauksen tunnistamismallit? Ensinnäkin lähestymistapa – sen sijaan, että luotettaisiin kuvankäsittelyyn, ReALM toimii tekstialueella. Tämä tekee siitä paljon kevyemmän ja tehokkaamman, mikä mahdollistaa sen suorittamisen suoraan mobiililaitteilla käyttäjän yksityisyyttä vaarantamatta.

Miten ReALM on parempi kuin GPT-4?

Applen tutkimusryhmä vertasi ReALM:ia markkinoiden voimakkaimpiin kielimalleihin tänään – GPT-3.5 ja GPT-4 OpenAI:lta. Tulokset olivat vaikuttavia. Viittauksen tunnistustehtävissä pienin ReALM-muunnos saavutti tarkkuuden, joka oli verrattavissa GPT-4:ään! Suuremmat ReALM-mallit jopa ylittivät GPT-4:n viittausten tunnistamisessa näytöllä näkyviin kohteisiin (http://arxiv.org/abs/2403.20329).

Mikä selittää tämän edun? Ensinnäkin ReALM on loistava erityisalan kysymyksissä, kuten älykotilaitteita koskevissa kysymyksissä. Tämä johtuu siitä, että ReALM osoittaa syvempää kontekstin ymmärrystä hienosäätämällä mallia erityisalan datalle.

Lisäksi, toisin kuin GPT-4, joka kouluttaa pääasiassa todellisten esineiden kuvilla, ReALM erottuu tekstuaalisten elementtien ja sovellusten käyttöliittymien komponenttien tunnistamisessa. Ja käyttöliittymän ymmärtäminen on kriittistä ääniavustajien sujuvassa vuorovaikutuksessa nykyisin käytettävien sovellusten kanssa.

ReALM

Lähde: DALL·E 3, kehotus: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Onko tämä todella älykkäiden avustajien aikakauden alku?

Itse asiassa ReALM:in integrointi Siriin voisi avata kokonaan uuden luvun ihmisen ja tietokoneen vuorovaikutuksessa. ReALM:in avulla Siri pystyy ymmärtämään komentoja, jotka sisältävät viittauksia älypuhelimen näytöllä näkyviin kohteisiin sekä taustalla toimiviin prosesseihin ja sovelluksiin. Mutta milloin tämä vaihtoehto on käyttäjien saatavilla? Se on edelleen tuntematon.

Jäämme spekuloimaan mallin teknisten kykyjen perusteella. Miten ReALM:ia hyödyntävä Siri voisi toimia? Esimerkiksi, jos selaat yrityslistasivustoa ja näet yrityksen, joka kiinnostaa sinua, voit yksinkertaisesti sanoa Sirille: “Soita tälle yritykselle”, ja avustaja – käyttäen ReALM:ia kontekstin analysoimiseen – löytää määrittelemäsi yrityksen puhelinnumeron ja aloittaa puhelun. Sinun ei tarvitse edes selittää tarkalleen, mitä yritystä tarkoitat.

A tämä on vasta ReALM:in mahdollisuuksien alku. Komennot kuten “Soita viimeisin soittolista” mahdollistaisivat intuitiivisen hallinnan multimedia-sovelluksista ja älykotilaitteista. ReALM voisi myös mahdollistaa Sirin ymmärtävän keskustelujen kontekstia ja komentohistoriaa, jotta avustaja reagoi asianmukaisesti käyttäjän aikaisempiin pyyntöihin. Tämä on askel kohti älykkäitä agenteja, joka vie meitä lähemmäksi ei vain sellaista tekoälyä, joka ymmärtää pyyntöjämme, vaan sellaista, joka osaa toteuttaa komentoja.

Ja tämä on vasta ReALM:in mahdollisuuksien alku. Komennot kuten “soita viimeisin soittolista” mahdollistaisivat intuitiivisen hallinnan media-sovelluksista ja älykotilaitteista. ReALM voisi myös mahdollistaa Sirin ymmärtävän keskustelujen kontekstia ja komentohistoriaa, jotta avustaja reagoi asianmukaisesti käyttäjän aikaisempiin pyyntöihin. Tämä on askel kohti älykkäitä agenteja, joka vie meidät lähemmäksi ei vain sellaista tekoälyä, joka ymmärtää pyyntöjämme, vaan sellaista, joka osaa toteuttaa komentoja.

Valitettavasti Android-laitteiden käyttäjien on odotettava. Tällä hetkellä ei ole tietoa Googlen suunnitelmista lisätä Geminin ominaisuuksia Google Assistantiin. Google Gemini -sovellus Android-laitteille on kehitetty (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), mutta se ei ole vielä saatavilla Yhdysvaltojen ulkopuolella.

ReALM

Lähde: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)

Yhteenveto

ReALM on Applen innovatiivinen lähestymistapa ääniavustajien kontekstin tunnistamisongelman ratkaisemiseen. Sen sijaan, että luotettaisiin kuvankäsittelyyn, tämä kielimalli muuntaa erilaisia konteksteja tekstuaaliseksi esitykseksi, jota se sitten käsittelee kielitehtävässä. Tämä lähestymistapa varmistaa paitsi korkean tunnistustarkkuuden myös kyvyn toimia mobiililaitteella käyttäjän yksityisyyttä vaarantamatta.

Antamalla Sirille pääsyn ReALM:iin voidaan tarjota luonnollisempia ja kontekstuaalisia ääni vuorovaikutuksia, mikä on tärkeä askel kohti todella älykkäitä avustajia. ReALM:in avulla Siri pystyy välittömästi reagoimaan komentoihin, jotka liittyvät näytön kohteisiin, sovelluksiin ja taustaprosesseihin. Yksi asia on varma – avustajien kontekstuaalisen tietoisuuden parantaminen on avain todella älykkäiden ja luonnollisten ääni vuorovaikutusten luomiseen, ja ReALM on epäilemättä tärkeä askel tuossa suunnassa.

ReALM

Jos pidät sisällöstämme, liity vilkkaaseen mehiläisyhteisöömme Facebookissa, Twitterissä, LinkedInissä, Instagramissa, YouTubessa, Pinterestissä, TikTokissa.

Robert Whitney

JavaScript-asiantuntija ja opettaja, joka valmentaa IT-osastoja. Hänen päämääränsä on nostaa tiimin tuottavuutta opettamalla muille, kuinka tehdä tehokasta yhteistyötä koodauksen aikana.

View all posts →

AI in business:

  1. 6 mahtavaa ChatGTP-laajennusta, jotka tekevät elämästäsi helpompaa
  2. Uusien liiketoimintamahdollisuuksien kartoittaminen ChatGPT-4:llä
  3. 3 mahtavaa tekoälykirjoittajaa, joita sinun on kokeiltava tänään
  4. Synteettiset näyttelijät. Kolme parasta tekoälyvideogeneraattoria
  5. Mitä ovat liiketoimintani idean heikkoudet? Aivoriihi ChatGPT:n kanssa
  6. Käyttämällä ChatGPT:tä liiketoiminnassa
  7. Uudet palvelut ja tuotteet, jotka toimivat tekoälyn avulla
  8. Automaattiset sosiaalisen median julkaisut
  9. Aikatauluttaminen sosiaalisen median julkaisuja. Kuinka tekoäly voi auttaa?
  10. AI:n rooli liiketoimintapäätöksenteossa
  11. Liiketoiminnan NLP tänään ja huomenna
  12. AI-avusteiset tekstichatbotit
  13. AI-sovellukset liiketoiminnassa - yleiskatsaus
  14. Uhkat ja mahdollisuudet tekoälyssä liiketoiminnassa (osa 2)
  15. Uhkat ja mahdollisuudet tekoälyssä liiketoiminnassa (osa 1)
  16. Mikä on tekoälyn tulevaisuus McKinsey Global Instituten mukaan?
  17. Tekoäly liiketoiminnassa - Johdanto
  18. Mikä on NLP, eli luonnollisen kielen käsittely liiketoiminnassa
  19. Google Translate vs DeepL. 5 konekäännöksen sovellusta liiketoiminnassa
  20. Automaattinen asiakirjakäsittely
  21. Äänibottien toiminta ja liiketoimintasovellukset
  22. Virtuaaliavustajateknologia, tai miten puhua tekoälyn kanssa?
  23. Mikä on liiketoimintatieto?
  24. Miten tekoäly voi auttaa liiketoimintaprosessien hallinnassa?
  25. Tämän päivän ja huomisen luova tekoäly
  26. Teknologinen älykkyys sisällönhallinnassa
  27. Tutkimus tekoälyn voimaa musiikin luomisessa
  28. 3 hyödyllistä tekoälyn graafisen suunnittelun työkalua. Generatiivinen tekoäly liiketoiminnassa
  29. AI ja sosiaalinen media – mitä ne sanovat meistä?
  30. Korvataanko liiketoiminta-analyytikot tekoälyllä?
  31. AI-työkalut johtajalle
  32. Tulevaisuuden työmarkkinat ja tulevat ammatit
  33. RPA ja API:t digitaalisessa yrityksessä
  34. Uudet vuorovaikutukset. Miten tekoäly muuttaa tapaamme käyttää laitteita?
  35. Monimuotoinen tekoäly ja sen sovellukset liiketoiminnassa
  36. Tekoäly ja ympäristö. 3 tekoälyratkaisua, jotka auttavat sinua rakentamaan kestävän liiketoiminnan
  37. AI-sisältödetektorit. Ovatko ne sen arvoisia?
  38. ChatGPT vs Bard vs Bing. Mikä AI-chatbotti johtaa kilpailua?
  39. Onko chatbot-tekoäly kilpailija Googlen haulle?
  40. Tehokkaat ChatGPT-kehotteet HR:lle ja rekrytoinnille
  41. Prompt-insinööritys. Mitä prompt-insinööri tekee?
  42. AI ja mitä muuta? Huipputeknologian trendit liiketoiminnassa vuonna 2024
  43. AI ja liiketoimintaetiikka. Miksi sinun pitäisi investoida eettisiin ratkaisuihin
  44. Meta AI. Mitä sinun pitäisi tietää Facebookin ja Instagramin tekoälytuetuista ominaisuuksista?
  45. AI-sääntely. Mitä sinun tarvitsee tietää yrittäjänä?
  46. 5 uutta tekoälyn käyttöä liiketoiminnassa
  47. AI-tuotteet ja -projektit - miten ne eroavat muista?
  48. AI asiantuntijana tiimissäsi
  49. AI-tiimi vs. roolien jako
  50. Miten valita urakenttä tekoälyssä?
  51. AI henkilöstöhallinnossa: Miten rekrytointiautomaation vaikutukset henkilöstöhallintaan ja tiimikehitykseen
  52. AI-avusteinen prosessiautomaation. Mistä aloittaa?
  53. Vuoden 2023 kuusi mielenkiintoisinta tekoälytyökalua
  54. Mikä on yrityksen tekoälyn kypsyysanalyysi?
  55. AI B2B-personalisointiin
  56. ChatGPT:n käyttötapaukset. 18 esimerkkiä siitä, miten voit parantaa liiketoimintaasi ChatGPT:n avulla vuonna 2024
  57. AI-mockup-generaattori. Top 4 työkalua
  58. Mikrooppiminen. Nopea tapa hankkia uusia taitoja
  59. Vuoden 2024 mielenkiintoisimmat tekoälyratkaisut yrityksissä
  60. Mitä haasteita tekoälyprojekti tuo mukanaan?
  61. Vuoden 2024 parhaat 8 tekoälytyökalua liiketoimintaan
  62. AI CRM: Mitä tekoäly muuttaa CRM-työkaluissa?
  63. UE:n tekoälylaki. Miten Eurooppa säätelee tekoälyn käyttöä
  64. Top 7 tekoälyverkkosivustojen rakentajaa
  65. Ilman koodia olevat työkalut ja tekoälyinnovaatiot
  66. Kuinka paljon tekoälyn käyttö lisää tiimisi tuottavuutta?
  67. Kuinka käyttää ChatGTP:tä markkinatutkimukseen?
  68. Miten laajentaa tekoälymarkkinointikampanjasi ulottuvuutta?
  69. AI liikenteessä ja logistiikassa
  70. Mitä liiketoiminnan kipupisteitä tekoäly voi korjata?
  71. Miten sovitat tekoälyratkaisun liiketoimintaongelmaan?
  72. Tekoäly mediassa
  73. AI pankkitoiminnassa ja rahoituksessa. Stripe, Monzo ja Grab
  74. AI matkailualalla
  75. Kuinka tekoäly edistää uusien teknologioiden syntyä
  76. AI verkkokaupassa. Yleiskatsaus globaaleista johtajista
  77. Top 4 tekoälykuvantekotyökalua
  78. Viisi parasta tekoälytyökalua tietoanalyysiin
  79. AI:n vallankumous sosiaalisessa mediassa
  80. Onko aina kannattavaa lisätä tekoälyä tuotekehitysprosessiin?
  81. 6 suurinta liiketoimintavirhettä, jotka aiheutti tekoäly
  82. AI-strategia yrityksessäsi - miten se rakennetaan?
  83. Parhaat tekoälykurssit – 6 mahtavaa suositusta
  84. Optimoinnin sosiaalisen median kuuntelua tekoälytyökalujen avulla
  85. IoT + AI, eli kuinka vähentää energiakustannuksia yrityksessä
  86. AI logistiikassa. 5 parasta työkalua
  87. GPT Store – yleiskatsaus mielenkiintoisimmista GPT:istä liiketoimintaan
  88. LLM, GPT, RAG... Mitä tekoälyn lyhenteet tarkoittavat?
  89. AI-robotit – liiketoiminnan tulevaisuus vai nykyisyys?
  90. Mikä on tekoälyn käyttöönoton kustannus yrityksessä?
  91. Mitä tekoälyasiantuntijat tekevät?
  92. Miten tekoäly voi auttaa freelancerin uralla?
  93. Työn automatisointi ja tuottavuuden lisääminen. Opas tekoälylle freelancereille
  94. AI startupille – parhaat työkalut
  95. Rakentaminen verkkosivusto tekoälyn avulla
  96. Yksitoista Labs ja mitä muuta? Lupaavimmat tekoälystart-upit
  97. OpenAI, Midjourney, Anthropic, Hugging Face. Kuka on kuka tekoälyn maailmassa?
  98. Synteettiset tiedot ja niiden merkitys liiketoimintasi kehittämisessä
  99. Huippu AI-hakukoneet. Mistä etsiä AI-työkaluja?
  100. Video AI. Uusimmat tekoälyvideogeneraattorit
  101. AI johtajille. Kuinka tekoäly voi helpottaa työtäsi
  102. Mitä uutta Google Geminissä? Kaikki, mitä sinun tarvitsee tietää
  103. AI Puolassa. Yritykset, kokoukset ja konferenssit
  104. AI-kalenteri. Kuinka optimoida aikasi yrityksessä?
  105. AI ja työn tulevaisuus. Kuinka valmistella yrityksesi muutokseen?
  106. AI-äänen kloonaus liiketoiminnalle. Kuinka luoda henkilökohtaisia ääniviestejä tekoälyn avulla?
  107. "Olemme kaikki kehittäjiä." Kuinka kansalaiskehittäjät voivat auttaa yritystäsi?
  108. Tosiasioiden tarkistaminen ja tekoälyn hallusinaatiot
  109. AI rekrytoinnissa – rekrytointimateriaalien kehittäminen askel askeleelta
  110. Sora. Miten OpenAI:n realistiset videot muuttavat liiketoimintaa?
  111. Midjourney v6. Innovaatioita tekoälyn kuvageneroinnissa
  112. PK-yritykset ja tekoäly. Kuinka PK-yritykset voivat kilpailla jättiläisten kanssa tekoälyn avulla?
  113. Miten tekoäly muuttaa vaikuttajamarkkinointia?
  114. Onko tekoäly todella uhka kehittäjille? Devin ja Microsoft AutoDev
  115. Parhaat tekoälychatbotit verkkokauppaan. Alustat
  116. AI-chatbotit verkkokaupalle. Tapaustutkimukset
  117. Miten pysyä ajan tasalla tekoälymaailman tapahtumista?
  118. Kesyttää tekoälyä. Kuinka ottaa ensimmäiset askeleet tekoälyn soveltamiseksi liiketoiminnassasi?
  119. Perplexity, Bing Copilot tai You.com? Vertailu tekoälyhakukoneista
  120. AI-asiantuntijat Puolassa
  121. ReALM. Maailmanlaajuinen kielimalli Applen toimesta?
  122. Google Genie — generatiivinen tekoälymalli, joka luo täysin interaktiivisia maailmoja kuvista
  123. Automaatio vai augmentaatio? Kaksi lähestymistapaa tekoälyyn yrityksessä
  124. LLMOps, tai kuinka hallita kielimalleja tehokkaasti organisaatiossa
  125. AI-videoiden tuotanto. Uudet horisontit videosisällön tuottamisessa yrityksille
  126. Parhaat tekoälyn transkriptiotyökalut. Kuinka muuttaa pitkät tallenteet tiiviiksi yhteenvedoiksi?
  127. Sentimenttianalyysi tekoälyn avulla. Miten se auttaa edistämään muutosta liiketoiminnassa?
  128. AI:n rooli sisällön moderoinnissa