Azərbaycan dilinin linqvistik analizi

Servisin versiyası: 1.06

Hazırkı sayt Azərbaycan dilinin emalı məqsədi ilə yaradılmış servisin imkanlarını nümayiş etdirir. Layihənin məqsədi azərbaycan dilinin korpusunu yaratmaqdır. Məlumdur ki, hər dilin korpusu o dildə tam mətn üzrə axtarışı həyata keçirmək üçün ilk addımdır. Bu addımı biz atdıq. İndi korpusun zənginləşdirilməsi üzərində çalışırıq.

Nümayiş etdirilən alqoritmlərdən biri olan Azərbaycan dilli Stemming təbii dilin emalı alqoritmlərini Azərbaycan dilinə tətbiq etmətyə imkan yaradır.

Digər bir avtomat Felin formalarını generasiya edir. Bu günə qədər bazada 8,800-ə yaxın felin 8 milyondan çox söz forması generasiya edilib.

Dəyişiklik tarixçəsi

  • 2017-05-20 Versiya 1.06
    Felin formaları bölməsinə -sana2 (-sanız2)-mı4 ədatları ilə bitən fellər də əlavə olunub. İndi avtomat sonu -a,-ə ilə bitən fellər üçün 1006, digər fellər üçün 946 söz forması generasiya edir. Həmçinin felin stemminq alqoritmi də bu ədatları tanıyıb qeyd edir.
    • -sana2 (-sanız2) ədatları yalnız felin əmr formasına artırılır.
    • -mı4 ədatı felin arzu şəklindən başqa bütün növlərinə artırılır. Bu ədat həmçinin idi hissəciyindən sonra da artırılır.
      Felin əmr formasında 2-ci şəxsin təki və cəmindən sonra da -mı4 ədatı işlədilmir.
      Azərbaycan dilində -mı4 ədatı felin şəxs şəkilçisindən önə keçmədiyinə görə felin formalarında həmişə bu ədat sona əlavə olunur. Lakin Osmanlı türkcəsində və bizin yazılı ədəbiyyatda bu ədata şəxs şəkilçisindən əvvəl də rast gəlinir. Ona görə stemminq alqoritmi bu cür sözlərdə şəxs şəkilçisindən öndə gələn zaman da həmin ədatı aşkar edir.
      -mı4 ədatı imiş hissəciyindən sonra işlənməsə də stemminq algoritmi bu cür formada verilmiş felləri də analız edir.
  • 2017-05-06 Versiya 1.05
    Azərbaycan sözlərini tapan alqoritm yenilənib.
  • 2017-04-25 Versiya 1.04
    Felin stemminq alqoritmi yenidən işlənib. Bu alqoritm istənilən formada verilmiş feli lemmalaşdırarkən onun hansı zaman (şühudi, nəqli keçmiş və qəti, qeyri-qəti gələcək göstərilməklə) və şəkildə olmasını, hansı şəxsin təki və ya cəmində işlənməsini, təsdiq və ya inkarda olmasını və hansı hissəcikləri qəbul etməsini müəyyən edə bilir.
    İndi fellin formalarının generasiyası zamanı bu alqoritmdən istifadə edilir. Ümumi stemminq alqoritminə bu funksiya hələ daxil edilməyib.
  • Bütün dəyişikliklər