Í tilkynningu segir að þetta sé markverður áfangi fyrir íslenska tungu, en hingað til hafi aðeins ein samheitaorðabók verið til fyrir íslensku og hún einungis aðgengileg gegn gjaldi.
Nýja samheitaorðabókin var unnin með nýstárlegum aðferðum. Gervigreindartækni var nýtt til að finna merkingarblæbrigði íslenskra orða með sjálfvirkum hætti. Verkefnið byggir á traustum grunni þriggja mikilvægra gagnasafna: Íslenskri nútímamálsorðabók Árnastofnunar, IceWordNet og Íslensku orðaneti, auk eigin mállíkana Miðeindar.
Á Samheiti.is má finna yfir 31 þúsund uppflettiorð með eitt eða fleiri samheiti skráð. Til gamans má geta þess að þau tvö orð sem hafa flest skráð samheiti eru annars vegar rógur og hins vegar uppstökkur með 63 samheiti hvort.
„Samheitaorðabók er ómissandi verkfæri fyrir öll sem skrifa á íslensku, hvort sem um er að ræða nemendur, fjölmiðlafólk, rithöfunda eða önnur sem vilja gera mál sitt blæbrigðaríkara og gæða það auknu lífi,“ segir Linda Heimisdóttir, framkvæmdastjóri Miðeindar.
„Með opnum aðgangi að þessari nýju samheitaorðabók stígum við skref í þá átt að gera íslenskt mál aðgengilegra og auðugra. Við teljum útgáfuna í aðdraganda Dags íslenskrar tungu vera táknræna fyrir þá stefnu okkar að efla íslenskuna með nútímatækni.“
Verkefnið var unnið með stuðningi bandaríska gervigreindarfyrirtækisins OpenAI, og er dæmi um hvernig hagnýta má gervigreind á ábyrgan hátt til að efla og styrkja íslenska tungu. Orðabókin verður aðgengileg á vefstaðnum Samheiti.is frá og með fimmtudeginum 14. nóvember og er öllum frjáls til notkunar,“ segir í tilkynningunni.