Монгол хэлний вөрднэт - MonWN
URL: https://github.com/num-milab/monwn
Энэхүү вөрднэтийг Принстоны их сургуулиас гаргасан англи хэлний вөрднетийн - WordNet ойлголт, үгийн утгын сүлжээнд харгацуулан зохион бүтээсэн. MonWN нь 26К үг, 3К утгын тайлбар, 23К синсет, 213 жишээ өгүүлбэртэй. Англи хэлний үгсийг ойролцоо утгаар нь бүлэг болгон синсет (synset) нэрээр ангилж, богино хэмжээний ерөнхий тодорхойлолтыг багтааж, эдгээр ойролцоо утгатай үгсийн хоорондох олон төрлийн утга зүйн хамаарлыг бичиж оруулсан. Утга зүйн хамаарлын хамгийн нийтлэг нь meronymy (A бол B –ийн хэсэг, өөрөөр хэлбэл B нь өөрийн хэсэг болгон А –г багтаана.), holonymy (B бол А –ын хэсэг, өөрөөр хэлбэл А өөрийн хэсэг болгон В –г багтаана.) , hyponymy (буюу troponymy) (A нь В –ээс явцуу хүрээтэй; А нь В –ийн төрөл зүйл), hypernymy (A бол B –ээс өргөн хүрээтэй), synonymy (A нь B –тэй адил), antonymy (A нь B –ийн эсрэг) гэх мэт байна.
Синсет (synset) бол ойролцоо утгаар хэрэглэж болдог үгсийн олонлог юм. Жишээ нь, {орон байр; байр; гэр орон} (хүн амьтны орогнон байрласан газар) гэсэн синсетийн үгсийг дараах жишээ өгүүлбэрт сольж бичихэд нэг утга илэрхийлж чадаж байна.
- “Дуучин Б.Болд гэр орондоо байхгүй байсан тул эрэн сурвалжлах зар тавьсан.”
- “Дуучин Б.Болд орон байрандаа байхгүй байсан тул эрэн сурвалжлах зар тавьсан.”
- “Дуучин Б.Болд байрандаа байхгүй байсан тул эрэн сурвалжлах зар тавьсан.”
Өгөгдлийн формат нь олон улсын OpenMultilingualWordnet форматаар бичигдсэн тул бусад хэлний өгөгдөлтэй харьцуулан ашиглах боломжтой.
MonWN-ийг хэрхэн хөгжүүлсэн тухай мэдээллийг https://aclanthology.org/2019.gwc-1.30.pdf өгүүллээс танилцаж болно.
Мөн энэ төсөлд өөрийн хувь нэмрийг https://github.com/num-milab/monwn хаягаар орж оруулаарай.
Энэ нөөцөд зориулж үүсгэсэн харагдац байхгүй байна
Нэмэлт мэдээлэл
Талбар | Утга |
---|---|
Өгөгдлийн сүүлийн шинэчлэл | 2022 11-р сар 14 |
Мета өгөгдөлийн сүүлийн шинэчлэл | 2022 11-р сар 14 |
Үүссэн | 2022 11-р сар 14 |
Хэлбэр | ZIP |
Ашиглах зөвшөөрөл | Creative Commons Attribution Share-Alike |
created | 2 жилээс өмнө |
format | ZIP |
id | fa387fa7-5327-4cb3-ade4-e69940e0bda0 |
package id | 5304b8c7-c634-4e25-975b-f0bb0936cba6 |
revision id | 5652a0ed-04ef-42ea-bfcb-1b6b0d93bc5c |
state | active |