21. yüzyılın hızla dijitalleşen dünyasında, yapay zekâ teknolojileri yalnızca bilgi işlem ve veri analizi alanında değil, edebî üretim süreçlerinde de önemli bir rol üstlenmeye başlamıştır. Bu teknolojiler, metin üretiminde hız, çeşitlilik ve yaratıcı olasılıklar sunarken, kültürel içeriklerin dijital ortamda yeniden üretiminde de yeni imkânlar sunmaktadır. Öte yandan, halk edebiyatı gibi yerel dil, ritim ve kültürel bağlamını yoğun biçimde taşıyan metinlerin yapay zekâ tarafından doğru ve özgün bir şekilde temsil edilip edilemeyeceği önemli bir araştırma konusu hâline gelmiştir. Yerel ağız, folklorik motifler, ritmik yapı ve toplumsal yaşamın aktarımı gibi unsurlar, kültürel mirasın gelecek kuşaklara eksiksiz aktarılmasında kritik öneme sahiptir. Bu nedenle, yapay zekânın edebî üretimde dilsel ve kültürel kodları nasıl işlediğini anlamak hem teknolojinin sınırlarını görmek hem de kültürel aktarımın güvenliğini sağlamak açısından büyük önem taşımaktadır. Ayrıca, bu süreçte geliştirilecek eleştirel yaklaşımların, yapay zekâ destekli metinlerin özgünlük, temsil ve kültürel hassasiyet açısından daha bilinçli bir biçimde değerlendirilmesine olanak tanıması beklenmektedir. Bundan hareketle, bu çalışma yapay zekânın edebî üretim süreçlerinde yerel dil ve kültürün temsilini incelemeyi, Türk halk kültürünün taşıyıcısı olan yerel dil, motif ve anlatı kalıplarının yapay zekâ metinlerinde ortaya çıkan eksilme ve dönüşüm biçimlerini ele almayı amaçlamaktadır. Yapay zekânın kültürel temsillerdeki eğilimlerini daha görünür kılmak amacıyla Alman halk edebiyatından seçilen örnekler karşılaştırmalı bir bağlamda değerlendirmeye alınmaktadır. Farklı tarihsel ve yazınsal geleneklere sahip iki edebî alanın birlikte ele alınması, yapay zekânın yerel kültüre yaklaşımında evrensel kalıplar ile kültüre özgü boşluklar arasındaki ayrımı daha net biçimde ortaya koymaya hizmet etmektedir. Türk halk edebiyatı örnekleri olarak Karacaoğlan’a atfedilen Bir Ayrılık Bir Yoksulluk Bir Ölüm şiiri, Irmızanın Alafı / Ege Şiveli Bir Aşk Hikâyesi, Erzurum Abdurrahman Gazi Efsanesi ve Karadeniz Şavşat Masalları ele alınmıştır. Alman halk edebiyatına ait örnekler arasında ise Ludwig Tobler tarafından derlenen Alemannik lehçesiyle S’Vreneli ab em Guggisberg halk şiiri, Heinrich Friedrich Wilhelm Raabe tarafından derlenmiş Aşağı Saksonya lehçesinde Dei Arwtenäter un dei Arwtenmeter köy hikâyesi, Brothers Grimm tarafından derlenen Bavyera lehçeli Schneewittchen masalı ve Svabya Almancasıyla Ulmer Spatz şehir efsanesi yer almaktadır. Bu değerlendirme kapsamında yapay zekâdan örnek metinlerin standart dildeki karşılıkları istenmekle birlikte yerel lehçeler veya ağızların yer aldığı metinler de yazması istenerek üretilen metinler üzerinden yerel dil, kültürel motif ve anlatı kalıplarının yapay zekâ tarafından ne ölçüde korunabildiği analiz edilmiştir. Çalışmanın yapısı bu doğrultuda şekillenmiş olup ilk olarak yapay zekânın kültürel analizlerdeki rolü tartışılmakta ve folklorik kodlar ile kültürel temsil kavramları tanıtılmaktadır. Daha sonra, Türk halk ve Alman halk edebiyatındaki edebî kodlar teorik olarak ele alınıp her iki edebiyatın dilsel, tematik ve kültürel özellikleri sunulmuştur. Bununla birlikte, yapay zekânın Türk halk edebiyatı üzerindeki uygulamaları incelenmiş; yerel ağız, ritim ve kültürel bağlamın yapay zekâ tarafından ne ölçüde yansıtıldığı, eksiklikler ve kültürel aktarım sorunları somut örneklerle ortaya konmuştur. Son olarak Alman halk edebiyatı bağlamında yapay zekânın yerel dili taklit etmedeki yetisi ele alınmış ve sonuç olarak Türk halk edebiyatı örnekleriyle karşılaştırmalı bir perspektifle değerlendirilmiştir. Elde edilen bulgulardan hareketle yapay zekânın edebiyat analizlerinde sağladığı olanaklar ile sınırlılıkları tartışılmış; kültürel aktarımın korunmasının önemi üzerinde durulmuştur.
In the rapidly digitalizing world of the twenty-first century, artificial intelligence technologies have begun to assume a significant role not only in the fields of data processing and analysis but also in literary production processes. While these technologies offer speed, diversity, and creative possibilities in text generation, they also introduce new opportunities for the reproduction of cultural content in digital environments. However, whether texts that strongly embody local language, rhythm, and cultural context such as folk literature can be accurately and authentically represented by artificial intelligence has emerged as an important area of research. Elements such as local dialects, folkloric motifs, rhythmic structures, and the transmission of social life are of critical importance for the complete transfer of cultural heritage to future generations. Therefore, understanding how artificial intelligence processes linguistic and cultural codes in literary production is of great significance both for identifying the limitations of the technology and for ensuring the security of cultural transmission. Moreover, it is expected that the critical approaches developed in this process will enable a more informed evaluation of AI-generated texts in terms of originality, representation, and cultural sensitivity. From this perspective, the present study aims to examine the representation of local language and culture in artificial intelligence driven literary production processes and to address the forms of reduction and transformation that emerge in artificial intelligence generated texts with regard to local language, motifs, and narrative patterns that serve as carriers of Turkish folk culture. In order to make the tendencies of artificial intelligence in cultural representations more visible, selected examples from German folk literature are examined within a comparative framework. Considering two literary traditions with distinct historical and literary backgrounds together serves to more clearly reveal the distinction between universal patterns and culture-specific gaps in artificial intelligence’s approach to local culture. In this study, texts representing different genres from Turkish folk and German folk literature were examined through a comparative approach. In this context, one example from each of the genres of poetry, story, fairy tale, and legend, each containing distinct dialectal features, was selected from both literatures. The Turkish folk literature examples include the poem Bir Ayrılık Bir Yoksulluk Bir Ölüm attributed to Karacaoğlan, Irmızanın Alafı / Ege Şiveli Bir Aşk Hikâyesi, Erzurum Abdurrahman Gazi Efsanesi, and Karadeniz Şavşat Masalları. Among the examples of German folk literature are the folk poem S’Vreneli ab em Guggisberg in the Alemannic dialect, compiled by Ludwig Tobler; the village story Dei Arwtenäter un dei Arwtenmeter in the Low Saxon dialect, compiled by Wilhelm Raabe; the Bavarian-dialect tale Schneewittchen, compiled by Brothers Grimm; and the urban legend Ulmer Spatz in Swabian German. Within the scope of this evaluation, artificial intelligence was asked to produce sample texts both in standard language equivalents and in forms incorporating local dialects or vernaculars. The generated texts were then analyzed to determine the extent to which local language features, cultural motifs, and narrative patterns could be preserved by artificial intelligence. The structure of the study was shaped accordingly. First, the role of artificial intelligence in cultural analysis is discussed, and the concepts of folkloric codes and cultural representation are introduced. Subsequently, the literary codes of Turkish folk and German folk literature are examined theoretically, and the linguistic, thematic, and cultural characteristics of both traditions are presented. In addition, applications of artificial intelligence in relation to Turkish folk literature are analyzed, and the extent to which local dialects, rhythm, and cultural context are reflected by artificial intelligence is demonstrated through concrete examples, along with observed deficiencies and issues in cultural transmission. Finally, within the context of German folk literature, artificial intelligence’s ability to imitate local language is addressed and evaluated from a comparative perspective alongside examples from Turkish folk literature. Based on the findings obtained, the possibilities and limitations offered by artificial intelligence in literary analysis are discussed, and the importance of preserving cultural transmission is emphasized.
Structured Abstract:
In the context of accelerating digitalisation in the 21st century, artificial intelligence technologies have increasingly become integrated not only into technical domains but also into literary production processes. In particular, generative AI systems’ capacity to produce poems, tales, legends, and folk narratives has raised new debates regarding the digital reproduction of cultural heritage. However, folk literature is not limited to linguistic structures; it also incorporates multilayered cultural components such as local dialects, rhythm, oral tradition, folkloric motifs, and collective memory. Therefore, the degree to which AI can accurately represent these cultural codes constitutes a significant research problem. The study is grounded in the observation that Turkish folk dialects are often not accurately recognised when translated into standard Turkish by AI systems, whereas German dialects tend to be processed with relatively higher accuracy. At the same time, in both traditions, AI shows similar limitations in identifying cultural context and locally embedded cultural elements. This study aims to examine the extent comparatively to which AI-supported text generation systems can recognise and reproduce local linguistic varieties, dialects, and cultural narrative elements in Turkish and German folk literature.
The study adopts a qualitative research design based on comparative literary analysis and cultural interpretation. The dataset consists of eight folkloric texts selected from Turkish and German folk literature. Turkish examples include Bir Ayrılık Bir Yoksulluk Bir Ölüm, Irmızanın Alafı / Ege Şiveli Bir Aşk Hikâyesi, Erzurum Abdurrahman Gazi Efsanesi and Karadeniz Şavşat Masalları. German examples include S’Vreneli ab em Guggisberg, Dei Arwtenäter un Dei Arwtenmeter, Schneewittchen, and Ulmer Spatz. The AI model was tested through tasks involving dialect recognition, translation into standard languages, regional classification, and generation of new narratives in the same linguistic styles. Data were analysed using descriptive and thematic analysis, focusing on lexical variation, phonological features, narrative tone, folkloric motifs, and cultural context. Additionally, the influence of contextual memory within the same session was observed.
The findings indicate that AI demonstrates significant limitations in recognising and reproducing Turkish folk dialects. Although the model partially identifies certain lexical items and expressions, it frequently confuses dialectal features and tends to normalise them into Standard Turkish, thereby eliminating distinctive local linguistic characteristics. In particular, examples from Ege, Karadeniz, and Erzurum dialects reveal insufficient preservation of regional phonological features and oral narrative rhythm. For instance, the Ege dialect term “deze” (meaning “aunt”) was incorrectly interpreted by the model as "dedenlerin", demonstrating semantic distortion in dialect recognition.
When generating new narratives, AI outputs tend to rely on generic folkloric structures rather than region-specific linguistic patterns. In Karagöl’ün Sırrı, the opening sentence, “Once upon a time, among the high mountains of Şavşat, there was a village where mist was never absent", illustrates a generalised fairy-tale structure rather than a culturally specific narrative form. Moreover, resetting prior inputs resulted in more anonymous and standardised outputs, indicating sensitivity to contextual memory. These limitations are associated with the agglutinative structure of Turkish, the high diversity of Anatolian dialects, and the limited digital representation of local dialectal data.
In contrast, AI performs relatively better in recognising and translating German dialects into Standard German. Dialects such as Alemannic, Bavarian, Low Saxon, and Swabian are more accurately processed. In Ulmer Spatz, for example, the model correctly translates “Friaher” as "Früher", “d’Leit” as “die Leute", “welle” as "wollten", and “s’Tor” as “das Tor", demonstrating its ability to detect phonological shifts. However, despite lexical accuracy, cultural and stylistic nuances are partially lost. The repetition pattern in “gschafft ond gschafft", which conveys oral rhythm and emotional emphasis, is reduced to a neutral written form in translation. Similarly, the diminutive suffix “-le” in "Holzbalkle", which carries both semantic and sociocultural meaning, is not fully preserved in Standard German.
The study concludes that while AI systems are capable of processing linguistic variation at a structural level, their ability to capture cultural depth remains limited. In Turkish folk literature, the primary limitation stems from the insufficient digital representation and the lack of standardised orthography of dialectal varieties. In German folk literature, translators achieve higher linguistic accuracy, but they still partially lose cultural tone, oral rhythm, and narrative atmosphere. Across both traditions, AI tends to reproduce folkloric narratives as statistical variations of existing patterns rather than culturally embedded creative productions. Furthermore, AI-generated texts can be interpreted within the framework of intertextuality, as they are produced through recombination of previously learned narrative structures. However, unlike human cultural production, which integrates lived experience, social context, and cultural memory, AI lacks embodied cultural awareness. Therefore, the findings suggest that enhancing dialect corpora, improving digital documentation of local languages, and developing culturally sensitive AI models are essential for more accurate representation of folk literature in digital environments.
Keywords: German language and literature, artificial intelligence, Turkish folk literature, German folk literature, folkloric codes, local language, cultural transmission.
Yapılandırılmış Özet:
Dijitalleşmenin hız kazandığı 21. yüzyılda yapay zekâ teknolojileri yalnızca teknik alanlarda değil, edebî üretim süreçlerinde de etkin biçimde kullanılmaya başlanmıştır. Özellikle üretken yapay zekâ modellerinin şiir, masal, efsane ve halk anlatıları oluşturabilmesi, kültürel mirasın dijital ortamda yeniden üretimi konusunda yeni tartışmaları beraberinde getirmiştir. Ancak halk edebiyatı ürünleri yalnızca dilsel yapılardan oluşmamakta; yerel ağız, ritim, sözlü kültür geleneği, folklorik motifler ve toplumsal hafıza gibi çok katmanlı kültürel unsurları da taşımaktadır. Bu nedenle yapay zekânın yerel kültürel kodları ne ölçüde doğru temsil edebildiği önemli bir araştırma problemi hâline gelmiştir. Bu çalışmanın amacı, yapay zekâ destekli metin üretim sistemlerinin Türk ve Alman halk edebiyatına ait yerel dil, ağız, lehçe ve kültürel anlatı unsurlarını ne ölçüde tanıyıp yeniden üretebildiğini karşılaştırmalı olarak incelemektir. Araştırma, Türk halk edebiyatına ait yerel ağızların yapay zekâ tarafından standart Türkçeye çeviri sürecinde çoğu zaman doğru biçimde tanınamadığı; Alman halk edebiyatına ait lehçelerin ise daha yüksek doğrulukla çözümlenip standart dile aktarılabildiği gözleminden hareket etmektedir. Bununla birlikte her iki edebiyat geleneğinde de yapay zekânın kültürel bağlamı ve yerel kültürel unsurları tespit etme konusunda benzer şekilde yetersiz kaldığı görülmektedir. Çalışma, bu farklılığın dijital veri yoğunluğu, lehçelerin yazım standardizasyonu ve akademik belgelenme düzeyiyle ilişkisini değerlendirmeyi amaçlamaktadır. Böylece araştırma, yapay zekânın folklorik metin üretimindeki imkân ve sınırlılıklarını ortaya koyarken kültürel temsil, dijital miras ve yapay zekâ destekli edebî üretim çalışmalarına katkı sunmayı hedeflemektedir.
Araştırma, nitel araştırma desenine dayalı karşılaştırmalı edebiyat ve kültürel analiz yöntemiyle yürütülmüştür. Veri setini Türk halk ve Alman halk edebiyatından seçilen sekiz farklı folklorik anlatı oluşturmaktadır. Türk halk edebiyatı örnekleri arasında Karacaoğlan’a atfedilen Bir Ayrılık Bir Yoksulluk Bir Ölüm şiiri, Irmızanın Alafı / Ege Şiveli Bir Aşk Hikâyesi, Erzurum Abdurrahman Gazi Efsanesi ve Karadeniz Şavşat Masalları yer almaktadır. Alman halk edebiyatına ait örnekler arasında ise Ludwig Tobler tarafından derlenen Alemannik lehçesindeki S’Vreneli ab em Guggisberg, Heinrich Friedrich Wilhelm Raabe tarafından derlenen Aşağı Saksonya lehçesindeki Dei Arwtenäter un dei Arwtenmeter, Brothers Grimm tarafından derlenen Bavyera lehçeli Schneewittchen masalı ve Şvabya Almancasına ait Ulmer Spatz şehir efsanesi incelenmiştir. Araştırma sürecinde yapay zekâ modeline hem standart dilde hem de yerel ağız ve lehçelerle yazılmış metinler verilmiş; modelden bu metinleri standart dile çevirmesi, ait oldukları bölgeyi belirlemesi ve aynı dilsel özelliklerle yeni anlatılar üretmesi istenmiştir. Metinler betimsel analiz ve tematik çözümleme yöntemleriyle değerlendirilmiş; yerel söz varlığı, ses özellikleri, folklorik motifler, anlatı tonu ve kültürel bağlam karşılaştırmalı olarak incelenmiştir. Ayrıca modelin aynı oturum içerisindeki önceki komutlardan etkilenme düzeyi de gözlemlenmiş; bağlamsal hafızanın metin üretimine etkisi değerlendirilmiştir.
Araştırma bulguları, yapay zekânın Türk halk edebiyatına ait yerel ağızları tanıma ve yeniden üretme konusunda belirgin sınırlılıklar taşıdığını göstermektedir. Model, bazı yerel sözcükleri ve söyleyiş biçimlerini kısmen tanıyabilmiş olsa da farklı ağız özelliklerini birbirine karıştırma eğilimi göstermiş; çoğu durumda yerel söyleyişleri standart Türkçeye yaklaştırarak özgün ağız özelliklerini büyük ölçüde ortadan kaldırmıştır. Özellikle Ege, Karadeniz ve Erzurum ağızlarına ait örneklerde bölgesel ses özellikleri ve sözlü kültüre özgü ritmik yapıların yeterince korunamadığı görülmüştür. Yerel ağızlarla verilen metinlerin standart Türkçeye çevrilmesinde ve ait oldukları bölgenin belirlenmesinde de çoğu zaman yanlış veya eksik sonuçlar ortaya çıkmıştır. Örneğin; “deze” kelimesi Ege ağızlarında “teyze” anlamında kullanılan bir akrabalık adıdır; ancak YZ çevirisinde bu ifade “dedenlerin” biçiminde yorumlanmış ve yerel akrabalık ilişkisini ifade eden anlam değişime uğramıştır.
Modelden belirli ağız özellikleriyle yeni anlatılar üretmesi istendiğinde ortaya çıkan metinlerin çoğunlukla yüzeysel folklorik öğeler taşıdığı gözlemlenmiştir. “Karagöl’ün Sırrı” başlıklı anlatıda yer alan “Vaktiyle Şavşat’ın yüksek dağlarının arasında, sislerin eksik olmadığı bir köy varmış.” ifadesi, belirli bir yöreye özgü anlatımdan çok genel masal kalıplarına dayalı bir atmosfer oluşturmaktadır. Önceki girdiler temizlenerek modelden yeniden üretim istendiğinde anlatının daha anonim ve standart bir yapıya yönelmesi, yapay zekânın bağlamsal hafızaya bağlı biçimde çalıştığını göstermektedir. Türk halk edebiyatı örneklerinde görülen bu sınırlılıkların temel nedenleri arasında Türkçenin eklemeli yapısı, Anadolu’daki ağız çeşitliliği ve yerel ağızların dijital ortamlarda sınırlı temsil edilmesi bulunmaktadır. Yerel ağızların standart bir yazım sistemine sahip olmaması ve aynı sözcüğün farklı biçimlerde yazılabilmesi, modelin bu ifadeleri tutarlı biçimde öğrenmesini zorlaştırmaktadır. Ayrıca yapay zekânın istatistiksel örüntülere dayalı çalışması nedeniyle standart Türkçede sık karşılaşılan kalıplara yöneldiği; daha az temsil edilen yerel dil unsurlarını yeterince öğrenemediği anlaşılmaktadır.
Alman halk edebiyatına ait örneklerde ise yapay zekânın lehçeleri tanıma ve standart Almancaya aktarma konusunda Türk halk edebiyatı örneklerine kıyasla daha başarılı sonuçlar verdiği görülmüştür. Özellikle Alemannik, Bavyera, Aşağı Saksonya ve Şvabya lehçelerine ait çok sayıda sözcük ve ifade biçimi doğru ya da büyük ölçüde doğru biçimde çözümlenebilmiştir. Örneğin; Ulmer Spatz efsanesinde kullanılan Şvabya lehçesine ait bazı sesbilgisel ve biçimbilimsel özelliklerin model tarafından tanınabildiği belirlenmiştir. Örneğin “Friaher” kelimesinin “Früher”, “d’Leit” ifadesinin “die Leute”, “welle” ifadesinin “wollten” ve “s’Tor” ifadesinin “das Tor” biçiminde doğru şekilde standart Almancaya aktarılması, modelin lehçedeki belirli ses değişimlerini tanıyabildiğini göstermektedir. Ancak çeviri temel anlamı korusa da Şvabya lehçesindeki tekrar yapısının oluşturduğu sözlü anlatım ritmi, mizahi ton ve yerel anlatım sıcaklığı standart dilde büyük ölçüde nötrleşmiştir. Aynı şekilde “Holzbalkle” ifadesindeki “-le” küçültme eki yalnızca nesnenin boyutunu değil, aynı zamanda samimi ve gündelik anlatım tonunu da yansıtırken, standart Almancadaki “Holzbalken” karşılığı bu kültürel nüansı tam olarak aktaramamaktadır. Bu durum, yapay zekânın lehçeleri dilsel düzeyde çözümleyebildiğini; ancak kültürel çağrışımları, sözlü anlatım ritmini ve yerel anlatı tonunu aynı yoğunlukta yansıtamadığını göstermektedir.
Her iki edebiyat geleneğinde de yapay zekânın kültürel bağlamı bütüncül biçimde yansıtmakta zorlandığı görülmüştür. Modelin üretim süreci doğrudan bir sözlük kullanımına değil, büyük veri kümelerinden öğrenilen istatistiksel örüntülere dayandığı için kültürel hafıza, toplumsal deneyim ve yerel yaşam pratiği gibi insan merkezli unsurlar üretime tam olarak yansımamaktadır. Bu nedenle yapay zekâ folklorik anlatıları çoğu zaman mevcut anlatı kalıplarının varyasyonları şeklinde yeniden üretmektedir. Çalışma, yapay zekânın halk edebiyatı metinlerinde yerel dil ve kültürel unsurları temsil etme konusunda belirli bir kapasiteye sahip olduğunu; ancak bu kapasitenin çoğunlukla yüzeysel taklit düzeyinde kaldığını ortaya koymaktadır. Araştırma ayrıca yapay zekâ üretimlerinin metinlerarasılık kavramı çerçevesinde değerlendirilebileceğini göstermektedir. Yapay zekâ, mevcut anlatı örüntülerini yeniden birleştirerek yeni metinler üretmekte; ancak insanın kültürel deneyimle gerçekleştirdiği yaratıcı dönüşümü tam olarak gerçekleştirememektedir. Sonuç olarak çalışma, yerel dil ve folklorik mirasın dijital ortamda korunabilmesi için ağız derlemelerinin artırılması, yerel dil verilerinin dijitalleştirilmesi ve kültürel bağlama duyarlı yapay zekâ modellerinin geliştirilmesi gerektiğini ortaya koymaktadır.
Anahtar Kelimeler: Alman dili ve edebiyatı, yapay zekâ, Türk halk edebiyatı, Alman halk edebiyatı, folklorik kodlar, yerel dil, kültürel aktarım.
ملخص منظم
في سياق تسارع وتيرة الرقمنة في القرن الحادي والعشرين، أصبحت تقنيات الذكاء الاصطناعي تندمج بشكل متزايد ليس فقط في المجالات التقنية، بل أيضًا في عمليات الإنتاج الأدبي. وعلى وجه الخصوص، أثارت قدرة أنظمة الذكاء الاصطناعي التوليدية على إنتاج القصائد والحكايات والأساطير والروايات الشعبية نقاشات جديدة حول الاستنساخ الرقمي للتراث الثقافي. ومع ذلك، لا يقتصر الأدب الشعبي على الهياكل اللغوية فحسب؛ بل يشمل أيضًا مكونات ثقافية متعددة الطبقات مثل اللهجات المحلية والإيقاع والتقاليد الشفوية والموضوعات الفولكلورية والذاكرة الجماعية. ولذلك، فإن الدرجة التي يمكن بها للذكاء الاصطناعي تمثيل هذه الرموز الثقافية بدقة تشكل مشكلة بحثية مهمة. تستند الدراسة إلى ملاحظة مفادها أن اللهجات الشعبية التركية غالبًا ما لا يتم التعرف عليها بدقة عند ترجمتها إلى اللغة التركية الفصحى بواسطة أنظمة الذكاء الاصطناعي، في حين أن اللهجات الألمانية تُعالج عادةً بدقة أعلى نسبيًا. وفي الوقت نفسه، تظهر الذكاء الاصطناعي في كلا التقاليد قيودًا مماثلة في تحديد السياق الثقافي والعناصر الثقافية المتأصلة محليًا. تهدف هذه الدراسة إلى فحص المدى النسبي الذي يمكن أن تتعرف فيه أنظمة إنشاء النصوص المدعومة بالذكاء الاصطناعي على التنوعات اللغوية المحلية واللهجات والعناصر السردية الثقافية في الأدب الشعبي التركي والألماني وإعادة إنتاجها.
تتبنى الدراسة تصميمًا بحثيًا نوعيًا يعتمد على التحليل الأدبي المقارن والتفسير الثقافي. تتكون مجموعة البيانات من ثمانية نصوص فولكلورية مختارة من الأدب الشعبي التركي والألماني. تشمل الأمثلة التركية Bir Ayrılık, Bir Yoksulluk, Bir Ölüm, Irmızanın Alafı / Ege Şiveli Bir Aşk Hikâyesi, Erzurum Abdurrahman Gazi Efsanesi, and Karadeniz Şavşat Masalları. The German examples include S’Vreneli ab em Guggisberg, Dei Arwtenäter un Dei Arwtenmeter, Schneewittchen, and Ulmer Spatz. تم اختبار نموذج الذكاء الاصطناعي من خلال مهام تتضمن التعرف على اللهجات، والترجمة إلى اللغات القياسية، والتصنيف الإقليمي، وتوليد روايات جديدة بنفس الأساليب اللغوية. تم تحليل البيانات باستخدام التحليل الوصفي والموضوعي، مع التركيز على الاختلافات المعجمية، والسمات الصوتية، ونبرة السرد، والموضوعات الفولكلورية، والسياق الثقافي. بالإضافة إلى ذلك، تمت ملاحظة تأثير الذاكرة السياقية داخل الجلسة نفسها.
تشير النتائج إلى أن الذكاء الاصطناعي يظهر قيودًا كبيرة في التعرف على اللهجات الشعبية التركية وإعادة إنتاجها. على الرغم من أن النموذج يحدد جزئيًا بعض العناصر المعجمية والتعبيرات، إلا أنه غالبًا ما يخلط بين السمات اللهجية ويميل إلى توحيدها في اللغة التركية القياسية، مما يؤدي إلى إزالة الخصائص اللغوية المحلية المميزة. على وجه الخصوص، تكشف الأمثلة من لهجات إيجة وكارادينيز وإرزوروم عن عدم الحفاظ الكافي على السمات الصوتية الإقليمية وإيقاع السرد الشفوي. على سبيل المثال، أخطأ النموذج في تفسير مصطلح اللهجة الإيجية ”deze“ (الذي يعني ’العمة‘) باعتباره ”dedenlerin“، مما يدل على تشويه دلالي في التعرف على اللهجات.
عند إنشاء روايات جديدة، تميل مخرجات الذكاء الاصطناعي إلى الاعتماد على هياكل فولكلورية عامة بدلاً من الأنماط اللغوية الخاصة بالمنطقة. في Karagöl’ün Sırrı، توضح الجملة الافتتاحية، ”ذات مرة، بين جبال شافشات العالية، كانت هناك قرية لم يغب عنها الضباب أبدًا“، بنية قصص خيالية عامة بدلاً من شكل سردي محدد ثقافيًا. علاوة على ذلك، أدى إعادة تعيين المدخلات السابقة إلى مخرجات أكثر مجهولة الهوية وتوحيدًا، مما يشير إلى حساسية تجاه الذاكرة السياقية. ترتبط هذه القيود بالبنية الترابطية للغة التركية، والتنوع الكبير لللهجات الأناضولية، والتمثيل الرقمي المحدود لبيانات اللهجات المحلية.
في المقابل، يؤدي الذكاء الاصطناعي أداءً أفضل نسبيًا في التعرف على اللهجات الألمانية وترجمتها إلى الألمانية القياسية. تتم معالجة اللهجات مثل الأليمانية، والبافارية، والساكسونية السفلى، والسوابية بدقة أكبر. في Ulmer Spatz، على سبيل المثال، يترجم النموذج بشكل صحيح ”Friaher“ إلى ”Früher“، و”d’Leit“ إلى ”die Leute“، و”welle“ إلى ’wollten‘، و”s’Tor“ إلى ”das Tor“، مما يدل على قدرته على اكتشاف التحولات الصوتية. ومع ذلك، على الرغم من الدقة المعجمية، تُفقد الفروق الثقافية والأسلوبية جزئيًا. يتم اختزال نمط التكرار في ”gschafft ond gschafft“، الذي ينقل الإيقاع الشفهي والتأكيد العاطفي، إلى شكل مكتوب محايد في الترجمة. وبالمثل، فإن لاحقة التصغير ”-le“ في ”Holzbalkle“، التي تحمل معنى دلاليًا واجتماعيًا ثقافيًا، لا يتم الحفاظ عليها بالكامل في الألمانية القياسية.
تخلص الدراسة إلى أنه في حين أن أنظمة الذكاء الاصطناعي قادرة على معالجة التباين اللغوي على المستوى الهيكلي، فإن قدرتها على التقاط العمق الثقافي تظل محدودة. في الأدب الشعبي التركي، تنبع القيود الأساسية من التمثيل الرقمي غير الكافي والافتقار إلى قواعد إملائية موحدة للأنواع اللهجية. في الأدب الشعبي الألماني، يحقق المترجمون دقة لغوية أعلى، لكنهم لا يزالون يفقدون جزئيًا النبرة الثقافية والإيقاع الشفهي والأجواء السردية. في كلا التقاليد، تميل الذكاء الاصطناعي إلى إعادة إنتاج الروايات الفولكلورية كاختلافات إحصائية للأنماط الموجودة بدلاً من إنتاجات إبداعية متأصلة ثقافياً. علاوة على ذلك، يمكن تفسير النصوص التي تولدها الذكاء الاصطناعي في إطار التداخل النصي، حيث يتم إنتاجها من خلال إعادة تجميع الهياكل السردية التي تم تعلمها مسبقاً. ومع ذلك، على عكس الإنتاج الثقافي البشري، الذي يدمج التجربة المعاشة والسياق الاجتماعي والذاكرة الثقافية، تفتقر الذكاء الاصطناعي إلى الوعي الثقافي المتجسد. لذلك، تشير النتائج إلى أن تعزيز مجموعات النصوص اللهجية، وتحسين التوثيق الرقمي للغات المحلية، وتطوير نماذج الذكاء الاصطناعي المراعية للثقافة، أمور أساسية لتمثيل أدب الفولكلور بشكل أكثر دقة في البيئات الرقمية.
الكلمات المفتاحية: اللغة والأدب الألمانيان، الذكاء الاصطناعي، الأدب الفولكلوري التركي، الأدب الفولكلوري الألماني، الرموز الفولكلورية، اللغة المحلية، نقل الثقافة.
Résumé Structuré:
Dans le contexte de la numérisation galopante du XXIᵉ siècle, les technologies d’intelligence artificielle s’intègrent de plus en plus non seulement dans les domaines techniques, mais aussi dans les processus de production littéraire. En particulier, la capacité des systèmes d’IA générative à produire des poèmes, des contes, des légendes et des récits populaires a soulevé de nouveaux débats concernant la reproduction numérique du patrimoine culturel. Cependant, la littérature populaire ne se limite pas aux structures linguistiques ; elle intègre également des composantes culturelles à plusieurs niveaux, telles que les dialectes locaux, le rythme, la tradition orale, les motifs folkloriques et la mémoire collective. Par conséquent, la mesure dans laquelle l’IA peut représenter avec précision ces codes culturels constitue un problème de recherche important. L’étude repose sur le constat que les dialectes populaires turcs ne sont souvent pas reconnus avec précision lorsqu’ils sont traduits en turc standard par des systèmes d’IA, alors que les dialectes allemands ont tendance à être traités avec une précision relativement plus élevée. Parallèlement, dans les deux traditions, l’IA présente des limites similaires dans l’identification du contexte culturel et des éléments culturels ancrés localement. Cette étude vise à examiner de manière comparative dans quelle mesure les systèmes de génération de texte assistés par l’IA peuvent reconnaître et reproduire les variétés linguistiques locales, les dialectes et les éléments narratifs culturels dans la littérature populaire turque et allemande.
L’étude adopte une approche de recherche qualitative fondée sur l’analyse littéraire comparative et l’interprétation culturelle. L’ensemble de données se compose de huit textes folkloriques sélectionnés dans la littérature populaire turque et allemande. Les exemples turcs comprennent Bir Ayrılık Bir Yoksulluk Bir Ölüm, Irmızanın Alafı / Ege Şiveli Bir Aşk Hikâyesi, Erzurum Abdurrahman Gazi Efsanesi et Karadeniz Şavşat Masalları. Les exemples allemands comprennent S’Vreneli ab em Guggisberg, Dei Arwtenäter un Dei Arwtenmeter, Schneewittchen et Ulmer Spatz. Le modèle d’IA a été testé à travers des tâches impliquant la reconnaissance des dialectes, la traduction vers des langues standard, la classification régionale et la génération de nouveaux récits dans les mêmes styles linguistiques. Les données ont été analysées à l’aide d’une analyse descriptive et thématique, en se concentrant sur la variation lexicale, les caractéristiques phonologiques, le ton narratif, les motifs folkloriques et le contexte culturel. De plus, l’influence de la mémoire contextuelle au sein d’une même session a été observée.
Les résultats indiquent que l'IA présente des limites importantes dans la reconnaissance et la reproduction des dialectes folkloriques turcs. Bien que le modèle identifie partiellement certains éléments lexicaux et expressions, il confond fréquemment les caractéristiques dialectales et a tendance à les normaliser en turc standard, éliminant ainsi les caractéristiques linguistiques locales distinctives. En particulier, des exemples tirés des dialectes d'Ege, de Karadeniz et d'Erzurum révèlent une préservation insuffisante des caractéristiques phonologiques régionales et du rythme narratif oral. Par exemple, le terme dialectal égéen « deze » (signifiant « tante ») a été interprété de manière erronée par le modèle comme « dedenlerin », ce qui démontre une distorsion sémantique dans la reconnaissance des dialectes.
Lors de la génération de nouveaux récits, les résultats de l'IA ont tendance à s'appuyer sur des structures folkloriques génériques plutôt que sur des schémas linguistiques spécifiques à une région. Dans Karagöl’ün Sırrı, la phrase d’ouverture, « Il était une fois, parmi les hautes montagnes de Şavşat, un village où la brume n’était jamais absente », illustre une structure de conte de fées généralisée plutôt qu’une forme narrative culturellement spécifique. De plus, la réinitialisation des entrées antérieures a donné lieu à des résultats plus anonymes et standardisés, indiquant une sensibilité à la mémoire contextuelle. Ces limites sont liées à la structure agglutinante du turc, à la grande diversité des dialectes anatoliens et à la représentation numérique limitée des données dialectales locales.
En revanche, l’IA obtient de meilleurs résultats dans la reconnaissance et la traduction des dialectes allemands vers l’allemand standard. Des dialectes tels que l’alémanique, le bavarois, le bas-saxon et le souabe sont traités avec plus de précision. Dans Ulmer Spatz, par exemple, le modèle traduit correctement « Friaher » par « Früher », « d’Leit » par « die Leute », « welle » par « wollten » et « s’Tor » par « das Tor », démontrant ainsi sa capacité à détecter les changements phonologiques. Cependant, malgré la précision lexicale, les nuances culturelles et stylistiques sont partiellement perdues. Le motif répétitif de « gschafft ond gschafft », qui transmet le rythme oral et l’emphase émotionnelle, est réduit à une forme écrite neutre dans la traduction. De même, le suffixe diminutif « -le » dans « Holzbalkle », qui porte une signification à la fois sémantique et socioculturelle, n’est pas entièrement préservé en allemand standard.
L'étude conclut que si les systèmes d'IA sont capables de traiter les variations linguistiques au niveau structurel, leur capacité à saisir la profondeur culturelle reste limitée. Dans la littérature populaire turque, la principale limitation découle de la représentation numérique insuffisante et de l'absence d'orthographe normalisée des variétés dialectales. Dans la littérature populaire allemande, les traducteurs atteignent une plus grande précision linguistique, mais ils perdent encore partiellement la tonalité culturelle, le rythme oral et l'atmosphère narrative. Dans les deux traditions, l’IA a tendance à reproduire les récits folkloriques comme des variations statistiques de modèles existants plutôt que comme des productions créatives ancrées dans la culture. De plus, les textes générés par l’IA peuvent être interprétés dans le cadre de l’intertextualité, car ils sont produits par la recombinaison de structures narratives apprises précédemment. Cependant, contrairement à la production culturelle humaine, qui intègre l’expérience vécue, le contexte social et la mémoire culturelle, l’IA manque de conscience culturelle incarnée. Par conséquent, les résultats suggèrent que l'enrichissement des corpus dialectaux, l'amélioration de la documentation numérique des langues locales et le développement de modèles d'IA sensibles à la culture sont essentiels pour une représentation plus précise de la littérature folklorique dans les environnements numériques.
Mots-clés: langue et littérature allemandes, intelligence artificielle, littérature folklorique turque, littérature folklorique allemande, codes folkloriques, langue locale, transmission culturelle.
Resumen Estructurado:
En el contexto de la acelerada digitalización del siglo XXI, las tecnologías de inteligencia artificial se han ido integrando cada vez más, no solo en los ámbitos técnicos, sino también en los procesos de producción literaria. En particular, la capacidad de los sistemas de IA generativa para producir poemas, cuentos, leyendas y narraciones populares ha suscitado nuevos debates sobre la reproducción digital del patrimonio cultural. Sin embargo, la literatura popular no se limita a las estructuras lingüísticas, sino que también incorpora componentes culturales de múltiples capas, como los dialectos locales, el ritmo, la tradición oral, los motivos folclóricos y la memoria colectiva. Por lo tanto, el grado en el que la IA puede representar con precisión estos códigos culturales constituye un problema de investigación. El estudio se basa en la observación de que los dialectos populares turcos a menudo no se reconocen con precisión cuando los sistemas de IA los traducen al turco estándar, mientras que los dialectos alemanes tienden a ser procesados con una precisión relativamente mayor. Al mismo tiempo, en ambas tradiciones, la IA muestra limitaciones similares a la hora de identificar el contexto cultural y los elementos culturales arraigados localmente. Este estudio tiene como objetivo comparar cómo los sistemas de generación de texto con IA pueden identificar y replicar variedades de lenguaje locales, dialectos y elementos culturales en la literatura popular de Turquía y Alemania.
El estudio adopta un diseño de investigación cualitativa basado en el análisis literario comparativo y la interpretación cultural. El conjunto de datos consta de ocho textos folclóricos seleccionados de la literatura popular turca y alemana. Los ejemplos turcos incluyen Bir Ayrılık Bir Yoksulluk Bir Ölüm, Irmızanın Alafı / Ege Şiveli Bir Aşk Hikâyesi, Erzurum Abdurrahman Gazi Efsanesi y Karadeniz Şavşat Masalları. Los ejemplos alemanes incluyen S’Vreneli ab em Guggisberg, Dei Arwtenäter un Dei Arwtenmeter, Schneewittchen y Ulmer Spatz. El modelo de IA se probó mediante tareas que implicaban el reconocimiento de dialectos, la traducción a lenguas estándar, la clasificación regional y la generación de nuevas narrativas en los mismos estilos lingüísticos. Los datos se analizaron mediante análisis descriptivo y temático, centrándose en la variación léxica, las características fonológicas, el tono narrativo, los motivos folclóricos y el contexto cultural. Además, se observó la influencia de la memoria contextual dentro de la misma sesión.
Los resultados indican que la IA muestra limitaciones significativas a la hora de reconocer y reproducir los dialectos populares turcos. Aunque el modelo reconoce algunos elementos y expresiones, a menudo confunde las características de los dialectos y tiende a convertirlas al turco estándar, eliminando así las particularidades lingüísticas locales. En particular, los ejemplos de los dialectos de Ege, Karadeniz y Erzurum revelan una conservación insuficiente de las características fonológicas regionales y del ritmo narrativo oral. Así, el término «deze» (tía) del dialecto de Ege fue identificado por el modelo erróneamente como «dedenlerin», lo que indica una distorsión semántica en el reconocimiento dialectal.
Al generar nuevas narrativas, los resultados de la IA tienden a basarse en estructuras folclóricas genéricas en lugar de en patrones lingüísticos específicos de cada región. En Karagöl’ün Sırrı, la frase inicial, «Érase una vez, entre las altas montañas de Şavşat, un pueblo donde la niebla nunca faltaba», ilustra una estructura de cuento de hadas generalizada en lugar de una forma narrativa culturalmente específica. Además, el restablecimiento de las entradas previas dio lugar a resultados más anónimos y estandarizados, lo que indica sensibilidad a la memoria contextual. Estas limitaciones están asociadas a la estructura aglutinante del turco, la gran diversidad de dialectos de Anatolia y la limitada representación digital de los datos dialectales locales.
Por el contrario, la IA obtiene resultados relativamente mejores en el reconocimiento y la traducción de dialectos alemanes al alemán estándar. Dialectos como el alemánico, el bávaro, el bajo sajón y el suabo se procesan con mayor precisión. En Ulmer Spatz, por ejemplo, el modelo traduce correctamente «Friaher» como «Früher», «d’Leit» como «die Leute», «welle» como «wollten» y «s’Tor» como «das Tor», lo que demuestra su capacidad para detectar cambios fonológicos. Sin embargo, a pesar de la precisión léxica, los matices culturales y estilísticos se pierden parcialmente. El patrón de repetición en «gschafft ond gschafft», que transmite ritmo oral y énfasis emocional, se reduce a una forma escrita neutra en la traducción. Del mismo modo, el sufijo diminutivo «-le» en «Holzbalkle», que conlleva tanto significado semántico como sociocultural, no se conserva plenamente en el alemán estándar.
El estudio concluye que, si bien los sistemas de IA son capaces de procesar la variación lingüística a nivel estructural, su capacidad para captar la profundidad cultural se sigue limitando. En la literatura popular turca, la principal limitación se deriva de la insuficiente representación digital y la falta de una ortografía estandarizada de las variedades dialectales. En la literatura popular alemana, los traductores logran una mayor precisión lingüística, pero siguen perdiendo parcialmente el tono cultural, el ritmo oral y la atmósfera narrativa. En ambas tradiciones, la IA tiende a recrear las historias populares como variaciones estadísticas de patrones que ya existen, en lugar de considerarlas producciones creativas con raíces culturales. Además, los textos generados por IA pueden interpretarse en el marco de la intertextualidad, ya que se producen mediante la recombinación de estructuras narrativas aprendidas previamente. Sin embargo, a diferencia de la producción cultural humana, que integra la experiencia vivida, el contexto social y la memoria cultural, la IA carece de una conciencia cultural incorporada. Los resultados indican que es importante aumentar los corpus dialectales, mejorar la documentación digital de las lenguas locales y crear modelos de IA que tengan en cuenta las diferencias culturales. Estos factores son cruciales para una representación más precisa de la literatura popular en entornos digitales.
Palabras clave: lengua y literatura alemanas, inteligencia artificial, literatura popular turca, literatura popular alemana, códigos folclóricos, lengua local, transmisión cultural.
结构化摘要:
在21世纪数字化进程加速的背景下,人工智能技术不仅日益融入技术领域,也逐渐渗透到文学创作过程中。特别是生成式人工智能系统创作诗歌、故事、传说和民间叙事的能力,引发了关于文化遗产数字化再现的新一轮讨论。然而,民间文学不仅限于语言结构,还包含多层面的文化要素,如地方方言、韵律、口头传统、民间题材及集体记忆。因此,人工智能能够多大程度上准确呈现这些文化代码,构成了一个重要的研究课题。本研究基于以下观察:当人工智能系统将土耳其民间方言翻译成标准土耳其语时,往往无法准确识别,而德语方言则往往能被相对更准确地处理。与此同时,在两种文学传统中,人工智能在识别文化语境及本土文化元素方面均存在类似的局限性。本研究旨在比较分析基于人工智能的文本生成系统在识别和再现土耳其及德国民间文学中的地方语言变体、方言及文化叙事元素方面的能力。
本研究采用基于比较文学分析与文化解读的定性研究设计。数据集包含从土耳其和德国民间文学中选取的八篇民间文学文本。土耳其语文本包括《Bir Ayrılık Bir Yoksulluk Bir Ölüm》、《Irmızanın Alafı / Ege Şiveli Bir Aşk Hikâyesi》、《Erzurum Abdurrahman Gazi Efsanesi》和《Karadeniz Şavşat Masalları》。德语文本包括《S’Vreneli ab em Guggisberg》、《Dei Arwtenäter un Dei Arwtenmeter》、《Schneewittchen》和《Ulmer Spatz》。通过涉及方言识别、译为标准语言、地域分类以及生成相同语言风格的新叙事等任务,对该AI模型进行了测试。数据分析采用描述性分析与主题分析,重点关注词汇变体、音系特征、叙事语气、民间传说母题及文化语境。此外,还观察了同一会话内上下文记忆的影响。
研究结果表明,AI在识别和再现土耳其民间方言方面存在显著局限。尽管该模型能部分识别某些词汇和表达,但它经常混淆方言特征,并倾向于将其规范化为标准土耳其语,从而消除了独特的当地语言特征。特别是来自爱琴海、黑海和埃尔祖鲁姆方言的例子表明,区域音系特征和口头叙事节奏的保留程度不足。例如,爱琴海方言中的词汇“deze”(意为“姑姑”)被模型错误解读为“dedenlerin”,这表明在方言识别中存在语义扭曲。
在生成新叙事时,AI的输出往往依赖于通用的民间故事结构,而非特定地区的语言模式。在《卡拉戈尔之谜》(Karagöl’ün Sırrı)中,开篇句“从前,在沙夫沙特的高山之间,有个雾气常驻的村庄”展现的是一种泛化的童话结构,而非具有文化特性的叙事形式。此外,重置先前的输入会导致输出结果更加匿名化和标准化,这表明系统对上下文记忆较为敏感。这些局限性与土耳其语的黏着语结构、安纳托利亚方言的高多样性,以及当地方言数据在数字层面的有限呈现有关。
相比之下,AI在识别和将德语方言翻译成标准德语方面表现相对更好。阿勒曼尼语、巴伐利亚语、低地萨克森语和施瓦本语等方言被处理得更为准确。例如,在《乌尔姆麻雀》(Ulmer Spatz)中,该模型正确地将“Friaher”译为“Früher”,将“d’Leit”译为“die Leute”,将“welle”译为“wollten”,并将“s’Tor”译为“das Tor”,展现了其识别音位变迁的能力。然而,尽管词汇准确,文化与风格上的细微差别却部分丢失了。“gschafft ond gschafft”中的重复模式本可传达口语节奏与情感强调,但在翻译中却被简化为中性的书面形式。同样,“Holzbalkle”中既承载语义又蕴含社会文化意义的昵称后缀“-le”,在标准德语中也未能得到完整保留。
研究结论指出,虽然人工智能系统能够在结构层面处理语言变体,但其捕捉文化深度的能力仍然有限。在土耳其民间文学中,主要限制源于数字表示不足以及方言变体缺乏标准化拼写。在德国民间文学中,译者虽然实现了更高的语言准确性,但仍然部分丢失了文化基调、口语节奏和叙事氛围。纵观这两种传统,AI倾向于将民间叙事作为现有模式的统计变体进行再现,而非作为植根于文化的创造性作品。此外,AI生成的文本可在互文性框架下进行解读,因为它们是通过重组先前学习的叙事结构而产生的。然而,与融合了生活经验、社会语境和文化记忆的人类文化生产不同,AI缺乏具身化的文化意识。因此,研究结果表明,扩充方言语料库、完善地方语言的数字化记录,以及开发具有文化敏感性的AI模型,对于在数字环境中更准确地呈现民间文学至关重要。
关键词:德语与德语文学、人工智能、土耳其民间文学、德国民间文学、民间文学代码、地方语言、文化传承。
Структурированное резюме:
В контексте ускоряющейся цифровизации XXI века технологии искусственного интеллекта все шире интегрируются не только в технические сферы, но и в процессы литературного творчества. В частности, способность генеративных систем ИИ создавать стихи, сказки, легенды и народные повествования вызвала новые дискуссии о цифровом воспроизведении культурного наследия. Однако народная литература не ограничивается лингвистическими структурами; она также включает многослойные культурные компоненты, такие как местные диалекты, ритм, устная традиция, фольклорные мотивы и коллективная память. Поэтому степень, в которой ИИ может точно отображать эти культурные коды, представляет собой значимую исследовательскую проблему. Исследование основано на наблюдении, что турецкие народные диалекты часто не распознаются точно при переводе на стандартный турецкий язык системами ИИ, в то время как немецкие диалекты, как правило, обрабатываются с относительно более высокой точностью. В то же время в обеих традициях ИИ демонстрирует схожие ограничения в идентификации культурного контекста и локально укорененных культурных элементов. Цель данного исследования — сравнительно изучить, в какой степени системы генерации текста на базе ИИ способны распознавать и воспроизводить местные лингвистические разновидности, диалекты и элементы культурного нарратива в турецкой и немецкой народной литературе.
Исследование использует качественный исследовательский дизайн, основанный на сравнительном литературном анализе и культурной интерпретации. Набор данных состоит из восьми фольклорных текстов, отобранных из турецкой и немецкой народной литературы. Примеры на турецком языке включают Bir Ayrılık Bir Yoksulluk Bir Ölüm, Irmızanın Alafı / Ege Şiveli Bir Aşk Hikâyesi, Erzurum Abdurrahman Gazi Efsanesi и Karadeniz Şavşat Masalları. Примеры на немецком языке включают S’Vreneli ab em Guggisberg, Dei Arwtenäter un Dei Arwtenmeter, Schneewittchen и Ulmer Spatz. Модель ИИ тестировалась с помощью задач, включающих распознавание диалектов, перевод на стандартные языки, региональную классификацию и генерацию новых нарративов в тех же лингвистических стилях. Данные анализировались с помощью описательного и тематического анализа с акцентом на лексические вариации, фонологические особенности, тон повествования, фольклорные мотивы и культурный контекст. Кроме того, наблюдалось влияние контекстуальной памяти в рамках одной сессии.
Результаты показывают, что ИИ демонстрирует значительные ограничения в распознавании и воспроизведении турецких народных диалектов. Хотя модель частично идентифицирует определенные лексические единицы и выражения, она часто путает диалектные особенности и склонна нормализовать их в стандартный турецкий язык, тем самым устраняя отличительные местные лингвистические характеристики. В частности, примеры из эгейского, черноморского и эрзурумского диалектов показывают недостаточное сохранение региональных фонологических особенностей и ритма устного повествования. Например, термин эгейского диалекта «deze» (означающий «тетя») был неверно интерпретирован моделью как «dedenlerin», что демонстрирует семантическое искажение при распознавании диалекта.
При генерации новых нарративов результаты ИИ, как правило, опираются на общие фольклорные структуры, а не на лингвистические паттерны, специфичные для конкретного региона. В Karagöl’ün Sırrı вступительное предложение «Давным-давно, среди высоких гор Шавшата, была деревня, где никогда не исчезал туман» иллюстрирует обобщенную сказочную структуру, а не культурно-специфическую форму повествования. Более того, сброс предыдущих входных данных привел к более анонимным и стандартизированным результатам, что указывает на чувствительность к контекстуальной памяти. Эти ограничения связаны с агглютинативной структурой турецкого языка, большим разнообразием анатолийских диалектов и ограниченным цифровым представлением данных о местных диалектах.
Напротив, ИИ демонстрирует относительно лучшие результаты при распознавании и переводе немецких диалектов на стандартный немецкий язык. Такие диалекты, как алеманский, баварский, нижнесаксонский и швабский, обрабатываются более точно. Например, в Ulmer Spatz модель правильно переводит «Friaher» как «Früher», «d’Leit» как «die Leute», «welle» как «wollten» и «s’Tor» как «das Tor», демонстрируя свою способность обнаруживать фонологические сдвиги. Однако, несмотря на лексическую точность, культурные и стилистические нюансы частично теряются. Паттерн повторения в «gschafft ond gschafft», который передает устный ритм и эмоциональную интонацию, в переводе сводится к нейтральной письменной форме. Аналогично, уменьшительное окончание «-le» в «Holzbalkle», несущее как семантическое, так и социокультурное значение, не полностью сохраняется в стандартном немецком языке.
Исследование приходит к выводу, что, хотя системы ИИ способны обрабатывать лингвистические вариации на структурном уровне, их способность улавливать культурную глубину остается ограниченной. В турецкой народной литературе основное ограничение связано с недостаточным цифровым представлением и отсутствием стандартизированной орфографии диалектных разновидностей. В немецкой народной литературе переводчики достигают более высокой лингвистической точности, но все же частично теряют культурный оттенок, устный ритм и повествовательную атмосферу. В обеих традициях ИИ склонен воспроизводить фольклорные нарративы как статистические вариации существующих шаблонов, а не как творческие произведения, укорененные в культуре. Кроме того, тексты, сгенерированные ИИ, можно интерпретировать в рамках интертекстуальности, поскольку они создаются путем рекомбинации ранее изученных нарративных структур. Однако, в отличие от человеческого культурного творчества, которое интегрирует жизненный опыт, социальный контекст и культурную память, ИИ лишен воплощенного культурного сознания. Таким образом, полученные результаты свидетельствуют о том, что расширение корпусов диалектов, улучшение цифровой документации местных языков и разработка моделей ИИ, учитывающих культурные особенности, имеют решающее значение для более точного представления народной литературы в цифровой среде.
Ключевые слова: немецкий язык и литература, искусственный интеллект, турецкая народная литература, немецкая народная литература, фольклорные коды, местный язык, культурная передача.
संरचित सारांश:
21वीं सदी में तेजी से हो रहे डिजिटलीकरण के संदर्भ में, कृत्रिम बुद्धिमत्ता प्रौद्योगिकियाँ न केवल तकनीकी क्षेत्रों में बल्कि साहित्यिक उत्पादन प्रक्रियाओं में भी तेजी से एकीकृत होती जा रही हैं। विशेष रूप से, जेनरेटिव एआई प्रणालियों की कविताएँ, कहानियाँ, किंवदंतियाँ और लोक कथाएँ बनाने की क्षमता ने सांस्कृतिक विरासत के डिजिटल पुनरुत्पादन के संबंध में नई बहसें खड़ी कर दी हैं।
हालांकि, लोक साहित्य केवल भाषाई संरचनाओं तक सीमित नहीं है; इसमें स्थानीय बोलियाँ, लय, मौखिक परंपरा, लोक-पौराणिक रूपांकनों और सामूहिक स्मृति जैसे बहु-स्तरीय सांस्कृतिक घटक भी शामिल हैं। इसलिए, एआई इन सांस्कृतिक कोडों का कितनी सटीकता से प्रतिनिधित्व कर सकता है, यह एक महत्वपूर्ण शोध समस्या है। यह अध्ययन इस अवलोकन पर आधारित है कि तुर्की की लोक बोलियों को एआई प्रणालियों द्वारा मानक तुर्की में अनुवादित करते समय अक्सर सटीक रूप से पहचाना नहीं जाता है, जबकि जर्मन बोलियों को अपेक्षाकृत अधिक सटीकता के साथ संसाधित किया जाता है।
साथ ही, दोनों परंपराओं में, एआई सांस्कृतिक संदर्भ और स्थानीय रूप से निहित सांस्कृतिक तत्वों की पहचान करने में समान सीमाएँ दिखाता है। इस अध्ययन का उद्देश्य तुलनात्मक रूप से यह जांचना है कि एआई-समर्थित पाठ निर्माण प्रणालियाँ तुर्की और जर्मन लोक साहित्य में स्थानीय भाषाई विविधताओं, बोलियों और सांस्कृतिक कथा तत्वों को किस हद तक पहचान और पुन: प्रस्तुत कर सकती हैं।
यह अध्ययन तुलनात्मक साहित्यिक विश्लेषण और सांस्कृतिक व्याख्या पर आधारित एक गुणात्मक अनुसंधान डिजाइन अपनाता है। डेटासेट में तुर्की और जर्मन लोक साहित्य से चुने गए आठ लोककथात्मक ग्रंथ शामिल हैं।
तुर्की उदाहरणों में Bir Ayrılık Bir Yoksulluk Bir Ölüm, Irmızanın Alafı / Ege Şiveli Bir Aşk Hikâyesi, Erzurum Abdurrahman Gazi Efsanesi और Karadeniz Şavşat Masalları शामिल हैं। जर्मन उदाहरणों में S'Vreneli ab em Guggisberg, Dei Arwtenäter un Dei Arwtenmeter, Schneewittchen, और Ulmer Spatz शामिल हैं। एआई मॉडल का परीक्षण बोली मान्यता, मानक भाषाओं में अनुवाद, क्षेत्रीय वर्गीकरण, और उसी भाषाई शैली में नए कथानक उत्पन्न करने जैसे कार्यों के माध्यम से किया गया था। डेटा का विश्लेषण वर्णनात्मक और विषयगत विश्लेषण का उपयोग करके किया गया, जिसमें शब्दावली में भिन्नता, ध्वन्यात्मक विशेषताएं, कथात्मक स्वर, लोक-साहित्यिक रूपांकनों, और सांस्कृतिक संदर्भ पर ध्यान केंद्रित किया गया। इसके अतिरिक्त, उसी सत्र के भीतर संदर्भात्मक स्मृति के प्रभाव का भी अवलोकन किया गया।
निष्कर्ष बताते हैं कि तुर्की की लोक बोलियों को पहचानने और पुन: प्रस्तुत करने में एआई को महत्वपूर्ण सीमाएँ हैं। यद्यपि मॉडल कुछ शब्दांशों और अभिव्यक्तियों की आंशिक पहचान करता है, यह अक्सर बोलियों की विशेषताओं को भ्रमित करता है और उन्हें मानक तुर्की में सामान्यीकृत करने की प्रवृत्ति रखता है, जिससे विशिष्ट स्थानीय भाषाई विशेषताएँ समाप्त हो जाती हैं। विशेष रूप से, एगे, कराडेनिज़ और एज़ुरम बोलियों के उदाहरण क्षेत्रीय ध्वन्यात्मक विशेषताओं और मौखिक कथा लय के अपर्याप्त संरक्षण को दर्शाते हैं।
उदाहरण के लिए, एगे बोली के शब्द "देज़े" (जिसका अर्थ है "चाची") को मॉडल ने गलत तरीके से "देदेल्लिन" के रूप में व्याख्यायित किया, जो बोली की पहचान में अर्थ-सम्बंधी विकृति को दर्शाता है।
जब नए कथानक उत्पन्न करते हैं, तो एआई के आउटपुट क्षेत्र-विशिष्ट भाषाई पैटर्न के बजाय सामान्य लोककथा संरचनाओं पर निर्भर करते हैं।
कारागोलुन सिर्री में, पहला वाक्य, "एक समय की बात है, शावशत के ऊँचे पहाड़ों के बीच, एक गाँव था जहाँ कोहरा कभी नहीं छंटता था", सांस्कृतिक रूप से विशिष्ट कथा रूप के बजाय एक सामान्यीकृत परी-कथा संरचना को दर्शाता है। इसके अलावा, पिछले इनपुट को रीसेट करने से अधिक गुमनाम और मानकीकृत आउटपुट प्राप्त हुए, जो संदर्भिक स्मृति के प्रति संवेदनशीलता को इंगित करता है।
ये सीमाएँ तुर्की की संलग्नक संरचना, अनातोलियाई बोलियों की उच्च विविधता, और स्थानीय बोलचाल के डेटा के सीमित डिजिटल प्रतिनिधित्व से जुड़ी हैं।
इसके विपरीत, एआई जर्मन बोलियों को मानक जर्मन में पहचानने और अनुवाद करने में अपेक्षाकृत बेहतर प्रदर्शन करता है। अलेमानिक, बावेरियाई, लो सैक्सन और स्वाबियन जैसी बोलियाँ अधिक सटीकता से संसाधित की जाती हैं।
उदाहरण के लिए, Ulmer Spatz में, मॉडल "Friaher" का सही अनुवाद "Früher" के रूप में, "d'Leit" का "die Leute" के रूप में, "welle" का "wollten" के रूप में, और "s'Tor" का "das Tor" के रूप में करता है, जो ध्वन्यात्मक परिवर्तनों का पता लगाने की इसकी क्षमता को प्रदर्शित करता है। हालाँकि, शब्दावली की सटीकता के बावजूद, सांस्कृतिक और शैलीगत बारीकियाँ आंशिक रूप से खो जाती हैं।
"gschafft ond gschafft" में दोहराव का पैटर्न, जो मौखिक लय और भावनात्मक जोर को व्यक्त करता है, अनुवाद में एक तटस्थ लिखित रूप में कम हो जाता है। इसी तरह, "Holzbalkle" में छोटा करने वाला प्रत्यय "-le", जिसमें अर्थगत और सामाजिक-सांस्कृतिक दोनों अर्थ निहित हैं, मानक जर्मन में पूरी तरह से संरक्षित नहीं है।
अध्ययन का निष्कर्ष है कि जबकि एआई सिस्टम संरचनात्मक स्तर पर भाषाई विविधता को संसाधित करने में सक्षम हैं, सांस्कृतिक गहराई को पकड़ने की उनकी क्षमता सीमित रहती है। तुर्की लोक साहित्य में, प्राथमिक सीमा अपर्याप्त डिजिटल प्रतिनिधित्व और बोलचाल की विविधताओं की मानकीकृत वर्तनी की कमी से उत्पन्न होती है। जर्मन लोक साहित्य में, अनुवादक उच्च भाषाई सटीकता प्राप्त करते हैं, लेकिन वे फिर भी सांस्कृतिक लहजे, मौखिक लय और कथात्मक माहौल को आंशिक रूप से खो देते हैं। दोनों परंपराओं में, एआई सांस्कृतिक रूप से निहित रचनात्मक प्रस्तुतियों के बजाय, लोककथाओं को मौजूदा पैटर्न के सांख्यिकीय परिवर्तनों के रूप में दोहराने की प्रवृत्ति रखता है। इसके अलावा, एआई-जनित ग्रंथों की व्याख्या अंतःपाठिकता के ढांचे के भीतर की जा सकती है, क्योंकि वे पहले से सीखे हुए कथात्मक संरचनाओं के पुनर्संयोजन के माध्यम से उत्पादित होते हैं। हालाँकि, मानव सांस्कृतिक उत्पादन के विपरीत, जो जीए गए अनुभव, सामाजिक संदर्भ और सांस्कृतिक स्मृति को एकीकृत करता है, एआई में मूर्त सांस्कृतिक जागरूकता का अभाव है।
इसलिए, निष्कर्ष यह बताते हैं कि डिजिटल वातावरण में लोक साहित्य के अधिक सटीक प्रतिनिधित्व के लिए बोलियों के संकलन को बढ़ाना, स्थानीय भाषाओं के डिजिटल दस्तावेजीकरण में सुधार करना, और सांस्कृतिक रूप से संवेदनशील एआई मॉडल विकसित करना आवश्यक है।
कीवर्ड: जर्मन भाषा और साहित्य, कृत्रिम बुद्धिमत्ता, तुर्की लोक साहित्य, जर्मन लोक साहित्य, लोक सांस्कृतिक कोड, स्थानीय भाषा, सांस्कृतिक संचरण।
By subscribing to E-Newsletter, you can get the latest news to your e-mail.