- Ләззат Тұрғынқызы, алдымен жоба туралы қысқа мәлімет берсеңіз. Қандай мақсат көзделіп отыр?
– Бұл ғылыми жобаның толық атауы – “Абай өлеңдерінің морфологиялық және поэтикалық белгіленімі” (БНҚ: BR21882334). Жоба әл-Фараби атындағы Қазақ ұлттық университетінде жүзеге асырылып жатыр. Негізгі мақсатымыз – Абай өлеңдерін қазіргі заманғы лингвистика мен цифрлық технологиялар тоғысындағы әдістермен зерттеу, нақтырақ айтсақ – кіші тілдік корпус жасау. Бұл корпус морфологиялық және поэтикалық тұрғыдан толық белгіленіп, қазақ тіліндегі поэзиялық мәтіндерді сандық талдауға жол ашады.
- “Ішкорпус” деген ұғымға түсініктеме беріп өтсеңіз. Оның ерекшелігі неде?
– Жалпы тілдік корпус – белгілі бір ережеге сай құрылып, өңделген мәтіндер жиынтығы. Ол тілдік бірліктерді автоматты түрде іздеуге, талдауға мүмкіндік береді. А. Байтұрсынұлы атындағы Тіл білімі институтына қарасты Қазақ тілінің ұлттық корпусының: ауызша, терминологиялық, мақал-мәтел, ономастикалық, заманауи поэзия т.б. ішкорпустары тәрізді белгілі бір автордың немесе нақты бір сала, бағытқа қатысты мәтіндер жиынтығының морфологиялық, синтаксистік, семантикалық және поэтикалық деңгейде толық белгіленген тілдік деректер базасы, яғни бұл корпус тек мәтіндердің жинағы емес, сонымен бірге олардың ішкі құрылымын, тілдік және поэтикалық ерекшеліктерін терең талдауға мүмкіндік береді. Осы корпус арқылы ақынның тілдік қолданысын, өлеңдерінің морфологиялық құрылымын, поэтикалық тәсілдерін тереңірек зерттеуге мүмкіндік туады.
- Жоба аясында нақты қандай жұмыстар атқарылып жатыр?
– Бірнеше бағытта жұмыс жүріп жатыр. Ең алдымен, Абай өлеңдерінің мәтіндік базасы жинақталды. Содан кейін морфологиялық белгіленім жүргізілді – яғни әр сөздің түбір, қосымшасын, грамматикалық түрленуі, қасиеттері анықталып, тегтелді. Сонымен бірге, поэтикалық элементтер – ұйқас, буын саны, ырғақ құрылымы, троптар мен фигуралар сияқты белгілер жүйеленіп отыр. Өздеріңіз білетіндей, бұл жұмыс тіл мамандарынан бөлек, әдебиеттанушылар мен IT мамандардың тығыз ынтымақтастығын талап етеді.
- Абай поэзиясын цифрландыру қазақ тіл білімі мен әдебиеттануға қандай жаңа мүмкіндіктер береді деп ойлайсыз?
– Абай шығармашылығы – қазақ әдеби тілінің қалыптасуындағы ең маңызды қайнар көзінің бірі. Цифрлық корпус осы тілді жаңа қырынан тануға көмектеседі. Мысалы, автоматты түрде жиілік талдауы, сөз қолданысындағы стильдік ерекшеліктер, морфологиялық модельдер сияқты аспектілерді қарастыруға болады. Бұл деректер негізінде жасанды интеллектке қазақ тілінің поэтикалық табиғатын үйрету, білім беру ресурстарын жаңғырту, тіпті әдеби шығармашылыққа көмек көрсету құралдарын жасау мүмкіндігі туады.
- Бұл жобаның білім беру жүйесіне ықпалы бола ма?
– Әрине, тілдік корпус негізінде мектеп пен жоғары оқу орындарына арналған интерактивті оқыту құралдарын дайындауға болады. Студенттер мен оқушылар Абайдың поэзиясын жай ғана жаттап қоймай, оның ішкі құрылымын, стильдік ерекшелігін заманауи технология көмегімен терең түсінуге мүмкіндік алады. Зерттеушілік қабілеттерді жетілдіруге және ұлттық рухани құндылықтарды насихаттауға да ықпал етеді. Сонымен қатар бұл жоба – қазақ тілін цифрлық әлемге лайықтау жолындағы нақты қадамдардың бірі.
- Алдағы уақытта осы жобаның нәтижесі қалай пайдаланылмақ?
– Қазіргі таңда корпус беті онлайн платформа ретінде дайындалуда. Кез келген зерттеуші, оқытушы немесе студент корпусты ашып, Абай өлеңдерінің толық жинағын, кез келген сөздің грамматикалық сипаттамасын, поэтикалық белгілерін көріп, статистикалық мәліметтер ала алады.
- Іш корпус әзірленіп жатыр екен. Алдағы уақытта бұл жобаны қалай дамыту жоспарыңыз бар? Қандай жаңа бағыттар қарастырылуда?
- Қазіргі таңда іш корпус негізінен морфологиялық және поэтикалық деңгейде белгіленіп жатыр. Бірақ толыққанды лингвистикалық зерттеу жүргізу үшін келесі кезеңде синтаксистік белгіленім жұмыстарын бастауды көздеп отырмыз. Бұл – өте маңызды және күрделі кезең.
Синтаксистік белгіленім – әрбір сөйлемнің құрылысын, сөйлем мүшелерінің өзара қатынасын, сөздердің синтаксистік қызметін айқындау деген сөз. Аталған белгіленім Абай поэзиясындағы инверсия, эллипсис, экспрессивті синтаксис сияқты құбылыстарды автоматты түрде тануға мүмкіндік береді. Бұл қазақ тілі үшін әлі игеріле қоймаған сала.
Сонымен қатар, осы корпус базасында синтаксистік құрылымдарды визуалды түрде көрсету, автоматты синтаксистік талдау құралдарын жасау сияқты міндеттер тұр. Мұндай даму қазақ тілін табиғи тілдерді өңдеу (NLP) саласында жаңа деңгейге көтереді. Жоба тек филологиялық бағытта емес, цифрлық технология мен жасанды интеллектпен тығыз байланысты өріс алып отыр.
Жалпы алғанда, іш корпус – тек бір реттік зерттеу емес, көпқырлы, кезең-кезеңімен тереңдетілетін ғылыми-инновациялық жоба.
Сұхбаттасушы: Алимтаева Лаззат Тұрғынқызы, филол.ғ.к., “Абай өлеңдерінің морфологиялық және поэтикалық белгіленімі” (БНҚ: BR21882334) жоба мүшесі.