A CORPUS-BASED SUGGESTION FOR WORDS TO BE TAUGHT AT C1 LEVEL IN TEACHING TURKISH AS A FOREIGN LANGUAGE

YABANCI DİL OLARAK TÜRKÇE ÖĞRETİMİNDE C1 DÜZEYİNDE ÖĞRETİLECEK KELİMELER İÇİN DERLEM TABANLI BİR ÖNERİ

A CORPUS-BASED SUGGESTION FOR WORDS TO BE TAUGHT AT C1 LEVEL IN TEACHING TURKISH AS A FOREIGN LANGUAGE

 
Author : Ramazan Şimşek  , Teymur Erol  
Type :
Printing Year : 2023
Number : 21
Page : 414-427
DOI Number: :
Cite : Ramazan Şimşek , Teymur Erol, (2023). A CORPUS-BASED SUGGESTION FOR WORDS TO BE TAUGHT AT C1 LEVEL IN TEACHING TURKISH AS A FOREIGN LANGUAGE . International Journal of Education Technology and Scientific Researches, 21, p. 414-427. Doi: 10.35826/ijetsar.555.
    


Summary

The planning of inputs such as grammatical structure, pronunciation and vocabulary in the foreign language education process directly affects the efficiency. Vocabulary is at the centre of the process in terms of the functional use of basic language skills of individuals learning the target language. Individuals who learn the target language through lists shaped according to levels will achieve high productivity with less effort. In the international literature, vocabulary studies are carried out through frequency lists. These frequency lists are formed through data repository called corpus, which are created with written and spoken texts with various types and structural features of the target language. In this study, it is aimed to determine the most frequently used noun, adjective and verb type words for C1 level in teaching Turkish as a foreign language. The data set of the research consists of the textbooks "Gazi, Yedi Klima, Türkçeye Yolculuk, Yeni Hitit, Yeni Istanbul" used at the C1 level in the field of teaching Turkish as a foreign language, and the reading materials Yenisey and Türkçe Okuyorum, which are used at the C1 level. In this context, the relevant materials were adapted to the database of the software used in the field of corpus linguistics and transferred to the digital environment. After the UTF code conversion, optical character reading errors were eliminated and C1 Level YDTÖ Materials Corpus consisting of 326,591 words was created. Words for which frequency lists were created by means of C1 Level YDTÖ Materials Corpus were transformed into base (lemma) by removing inflectional morpheme. Considering the frequency intensities, the most frequently used words in the type of noun, adjective and verb were determined as a result of the concordance analysis by considering the minimum f(10) value. Through this list, an important contribution has been made to those who learn and teach Turkish as a foreign language; 250 nouns, 250 adjectives and 250 verbs that are most frequently used in teaching Turkish as a foreign language at an advanced level have been suggested. This study is not a final study, but with the aim of being a reference for researchers and publishers, it has prioritized to use the advantages of software and language education fields.Keywords

Turkish, Corpus, Turkish as a Foreign Language, Advanced Level, Course MaterialsAbstract

Yabancı dil eğitimi sürecinde gramer yapısı, telaffuz, söz varlığı gibi girdilerin planlanması verimliliği doğrudan etkilemektedir. Hedef dili öğrenen bireylerin temel dil becerilerinin işlevsel şekilde kullanımı özelinde sözvarlığı sürecin merkezinde yer almaktadır. Seviyelere göre şekillendirilmiş listeler aracılığıyla hedef dili öğrenen bireyler az emekle yüksek verimlilik elde edecektir. Uluslararası literatürde sözvarlığı çalışmaları sıklık listeleri üzerinden yürütülmektedir. Bu sıklık listeleri hedef dile ait çeşitli tür ve yapısal özelliklere sahip yazılı, sözlü metinlerle oluşturulan ve derlem adı verilen veri havuzları üzerinden şekillendirilmektedir. Bu çalışmada da yabancı dil olarak Türkçe öğretiminde C1 seviyesi için en sık kullanılan isim, sıfat ve fiil türündeki kelimelerin tespit edilmesi amaçlanmıştır. Araştırmanın veri setini yabancı dil olarak Türkçe öğretimi alanında C1 düzeyinde kullanılan Gazi, Yedi İklim, Türkçeye Yolculuk, Yeni Hitit, Yeni İstanbul ders kitapları ve C1 düzeyinde kullanılan Yenisey, Türkçe okuyorum okuma materyalleri oluşturmaktadır. Bu kapsamda ilgili materyaller derlem dilbilim alanında kullanılan yazılımların veri tabanına uygun hale getirilmiş ve dijital ortama aktarılmıştır. UTF kod dönüşümü sonrasında optik karakter okuma hataları giderilmiş, 326.591 kelimeden oluşan Türkçe C1 Derlemi oluşturulmuştur. C1 Düzeyi YDTÖ Materyalleri Derlemi aracılığıyla sıklık listeleri oluşturulmuş kelimeler çekim eklerinden arındırılarak taban(lemma) haline getirilmiştir. Frekans yoğunlukları dikkate alınarak en sık kullanılan isim, sıfat, fiil türündeki kelimeler minimum f(10) değeri gözetilip uyumluluk (concordance) analizi neticesinde tespit edilmiştir. Bu liste aracılığı ile yabancı dil olarak Türkçe öğrenenlere ve öğretenlere önemli bir katkı sağlanmış; ileri düzeyde yabancı dil olarak Türkçe öğretiminde en sık kullanılan 250 isim, 250 sıfat ve 250 fiil önerisinde bulunulmuştur. Bu çalışma nihai bir çalışma olmayıp araştırmacılar ve yayıncılar açısından bir referans olma amacı da taşıyarak yazılım ve dil eğitimi alanlarının avantajlarını kullanmayı öncelemiştir.Keywords

Türkçe, Derlem, Yabancı dil olarak Türkçe, İleri Düzey, Ders Materyalleri