
Yapay Zeka ve Doğal Dil İşleme (NLP)
1. Bölüm: Yapay Zeka Nedir?
Yapay zeka sistemleri, belirli bir amaç doğrultusunda, kendisine sunulan verileri çeşitli algoritmik hesaplamalardan geçirmek suretiyle işleyen bir zeka türüdür. Yapay zeka alanının öncülerinden birisi olan John McCarthy, yapay zekanın tanımını yaparken “Yapay zekanın amacı, zeki gibi davranan makinelerin geliştirilmesidir.” diyerek yapay zekanın zeki olması yönüne dikkatleri çeker (Çekin, 2021). Bununla birlikte, bilgisayar biliminin atası olarak kabul edilen Alan Turing, Computing Machinery and Intelligence adlı makalesinde çok önemli ve yapay zeka biliminin ilk sorusunu sorar; makineler düşünebilir mi (Turing, 1950)? (doğal dil işleme)
Yapay zeka kendisine sunulan verileri, algoritmik hesaplamalarla işleyerek ortaya yeni ve anlaşılabilir sonuçlar çıkaran sistemlerdir. Bu sonuçlar, sunulan verilerin doğruluğu ve niceliğiyle birlikte, algoritmanın hazırlanması sürecindeki farklı yaklaşımlar neticesinde değişiklikler gösterebilir. Bu yüzden, örneğin güvenlik kameraları vasıtasıyla kişilerin kadın mı erkek mi olduğunu saptamak üzere geliştirilen bir yapay zeka sistemi, chatbot dediğimiz, insanlarla sohbet etmek üzere tasarlanmış bir yapay zeka sistemiyle aynı işlevi göremez. Bununla birlikte kendisine verilen tüm görevleri yerine getirebilen bir yapay zeka sistemi henüz üretilebilmiş değildir. İnsan zekasına benzer bir biçimde aldığı verileri işleyebilmesi ve mantıklı sonuçlar elde edebilmesi gereken bu sistemler şu anda bir hayalden öteye gitmemektedir.
2. Bölüm: Doğal Dil İşleme (Natural Language Processing)
Doğal dil işleme sistemleri, halihazırda var olan doğal dillerin işlenmesi, çözümlenmesi, anlaşılması ve yeniden üretilmesini sağlayan sistemlerdir. Söz konusu sistemler dilbilimciler ile yapay zeka uzmanlarının birlikte çalışabildiği alanların başında gelmektedir.
Doğal dil işleme sistemlerinin insanlığa sunduğu ve sunabileceği yararlar oldukça fazladır. Yazılan metinlerin otomatik bir biçimde başka bir dile çevrilmesi, yazım esnasında yapılan dil bilgisi, yazım, anlam ve bilumum hataların anında düzeltmesinin yapılması, diller arası çeviri, verilen metin içerisinden istenen bilgiyi çıkarabilme (Adalı, 2012), gibi çeşitli yararlı faaliyetler şu anda bile birçok insan tarafından gündelik biçimde kullanılmaktadır. Doğal dil işlenmesi sırasında yapay zekanın kendisine verilen verileri, yani doğal konuşmayı, algılayıp mantıklı bir anlam çıkarması doğal dil işleme sisteminin altında yatan temel amaçlardan bir tanesidir.
Doğal dil işleme sistemlerinde kullanılan dört adet teknik bulunmaktadır. Bu teknikler sırasıyla “istatiksel teknik”, “stokastik, değişken teknik”, “kural tabanlı teknik” ve “hibrit teknik” olarak adlandırılır (Malik, 2022).
İstatiksel teknik kullanılırken adından da anlaşılabileceği üzere istatistik bilimi kullanılarak doğal dilin anlaşılması amaçlanır. Burada makine öğrenmesi algoritmaları kullanılarak büyük veri kümelerinden, doğal dildeki anlamı ve kelimelerin anlamlarını öğrenmeye çalışılır. Bu alanda en çok kullanılan algoritma matematikçi Thomas Bayes’in sınıflandırma algoritması olan Bayes algoritmasıdır. Bayes algoritmasında belirli bir oranda öğretilmiş veriler bulunmaktadır. Her öğretilmiş verinin bir kategorisi bulunmak zorundadır. Bundan sonra algoritma sisteme girilen verileri, daha önceden öğretilmiş verilerin kategorisine göre, hangi kategoriye yerleştirileceği ihtimalini hesaplar. Bu açıdan bakıldığında, sistemde ne kadar çok öğretilmiş veri ve ne kadar çok kategori varsa Bayes algoritması o derece doğru çalışır. Basit bir örnek olarak, bir doğal dil işleme sistemi Bayes algoritmasını kullanarak, bir metnin içeriğinin olasılıkla hangi sınıfa ait olduğunu tahmin edebilir. Örneğin, bir roman eleştirisi için, metin analizi yapılarak, olumlu veya olumsuz bir yorum olduğu belirlenebilir. Bayes algoritması, metindeki belirli kelimelerin sınıflandırmaya ne kadar etki ettiğini de dikkate alır. Bir roman eleştirisinde “harika” kelimesi geçtiğinde, bu kelimenin olumlu bir yorum olduğu anlaşılabilir. Benzer şekilde, “sıkıcı” kelimesi geçtiğinde, bu kelimenin olumsuz bir yorum olduğu anlaşılabilir.
Stokastik ya da değişken teknik kullanılırken stokastik algoritmalar kullanılmaktadır. Buna en güzel örnek Gizli Markov Modeli’dir. Bu modelde örneğin bir makaleyi, bir öyküyü veya bir romanı belirli kategorilere göre sınıflandırmak istediğinizi düşünelim. Bu durumda, gizli durumlar belirli kelimeler veya kelime grupları olabilir. Gizli Markov Modeli, önceki verilerden elde edilen gizli durumlar ile yeni metinlerin belirli kategoriye ait olma olasılıklarını hesaplayabilir. Örnek olarak bir doğal dil işleme sistemi Gizli Markov Modeli kullanarak bir metni analiz edebilmektedir. Burada metindeki her cümle ya bir durum ya da “gizli” bir duruma göre kategorize edilir. Örneğin “Ben her akşam oyun oynarım” cümlesindeki kelimelerin her biri birer durum olarak atanır. Her bir durum arasındaki geçiş ihtimalleri Gizli Markov Modeli kullanılarak cümledeki kelimelerin sırasının analizi yapılabilmektedir.
Bir diğer teknik ise kural tabanlı tekniktir. Kural tabanlı teknik kullanılırken geliştiricilerin söz konusu dile ait kuralları doğru ve eksiksiz bir biçimde tanımlayabilmeleri bu tekniğin en önemli kısmını oluşturmaktadır. Çünkü doğal dil işleme sürecinde yapay zeka her bir kelime veya noktalama işaretini bir “token” olarak algılar ve bu tokenler arasındaki bağı anlamaya çalışırken o dile ait kuralları takip eder. Bu açıdan bir dilbilimciyle çalışılması bu süreçte ortaya çıkabilecek sorunların büyük oranda önüne geçecektir.
Son olarak hibrit teknik dediğimiz yöntem bulunur. Hibrit teknik büyük oranda istatiksel teknik ile kural tabanlı teknik yöntemin bir karışımından oluşur. Hibrit teknikler daha çok dilin karmaşık olduğu durumlarda tek bir tekniğin yeterli sonucu doğuramaması sonucu geliştirilen özel ve spesifik çözümlerdir.
3. Bölüm: Derin Öğrenme Ve Nlp
Derin öğrenme (Deep Learning) yapay zeka sistemlerinin altında bir yaklaşım olarak karşımıza çıkar. Derin öğrenme yaklaşımının bulunmadığı yapay zeka yaklaşımlarında, öznitelik dediğimiz bilgilerin sisteme girilmesi gerekir (Dayan & Yılmaz, 2022). Bu sayede makine verileri işlerken öznitelik çıkarımını kendisi yapmaz, önceden girilen verileri kullanır. Derin öğrenme yaklaşımında ise, makinenin bu özniteliği kendisinin çıkarması hedeflenir. Katmanlı bir öğrenme metodu olan bu yaklaşımda ilk önce en önemsiz nitelikteki özelliklerden başlanır ve en önemli özelliğe doğru çıkılır. Her bir katmanda çok geniş bir yapay sinir ağı bulunur. Bu yüzden bu sistemlerin öğrenme ve karmaşık problemleri çözme yetenekleri son derece güçlüdür.
Derin öğrenme yaklaşımının yaygınlaşması sonucu doğal dil işleme sistemlerinde de artık bu yaklaşım aktif biçimde kullanılmaktadır. Klasik yöntemlerden ayrılan bu yaklaşımda öznitelik araştırmasını kendisi yapan makine, geliştiricilerin yüklediği özniteliklerle sınırlı kalmıyor ve bu sayede makine bir öğrenme süreciyle birlikte daha esnek ve daha nokta atışı sonuçlar çıkarabiliyor.
Bu durumu şu örnekle açıklayabiliriz, (Anonim, 2022) örneğin, potansiyel müşterileri tespit etmek amacıyla bir anahtar kelime listesi oluşturan bir seyahat acentesi olduğunuzu hayal edin. Listenize “tatil”, “uçuş”, “gezi”, “dalış” gibi kelimeler ekleyebilirsiniz. Doğal dil işleme sistemlerini kullanan bir yapay zeka, doğru bağlamda “Antalya” ve “Bodrum” araması yapan bir kullanıcının seyahatle de ilgileneceğini anlayacaktır. Söz konusu bağlamı, örnekte yer alan şehirlerin çoğunlukla tatil amacıyla gidildiği ve aramalar yapıldığında örneğin “Bodrum tatili”, “Antalya’da dalış” gibi cümlelerin içerisinden çıkarır.
İkinci olarak, derin öğrenmeye dayalı doğal dil işleme sistemleri, kullanıcıların anahtar kelime hakkındaki olumlu veya olumsuz düşüncelerini analiz edebilir ve buna göre çıkardığı sonuçları özelleştirebilir. Örneğin bir kullanıcı “Antalya” ve “dalış” yerine “Antalya” ve “yangın” için arama yaparsa, yapay zeka bu kullanıcının Antalya anahtar kelimesini seyahat yapmak amacıyla kullanmadığını ve bir seyahat acentesi için hedef müşteri olmayabileceğini anlayacaktır.
4. Bölüm: Sonuç
Sonuç olarak, doğal dil işleme sistemleri (NLP), derin öğrenme modellerinin geliştirilmesi sayesinde son yıllarda muazzam ilerlemeler kaydetmiş durumda. Sinir ağlarının ve derin sinir ağlarının yeteneklerinden yararlanarak, dil çevirisi, konuşma tanıma, duygu analizi, metin sınıflandırması ve daha fazlası gibi çok çeşitli görevlerin üstesinden gelmek için doğal dil işleme sistemleri geliştirilmiş ve geliştirilmeye devam etmektedir. Bu sistemler insanlığa faydalı pek çok sonuç gösterdi ve çeviri hizmetleri, müşteri desteği ve sanal asistanlar dahil olmak üzere birçok endüstride devrim yarattı. Tüm bu başarılara rağmen, doğal dil işleme alanında yapılacak daha çok iş var ve araştırmacılar doğal dili işlemek için yeni teknikler ve modeller geliştirmeye devam ettikçe daha fazla ilerleme bekleyebiliriz.
“Yapay Zeka ve Robot Hukuku” alanımızdaki tüm blog yazılarımıza bağlantıdan ulaşabilirsiniz.
Hukuk ve Bilişim Dergisi’nin geçmiş sayılarını okumak için bağlantıya tıklayınız.
Yazar: Av. Serhat Can ALKAN
Kaynakça
Adalı, E. (n.d.). Doğal Dil İşleme (Natural Language Processing). 19. https://dergipark.org.tr/tr/download/article-file/207209
A. (2022, April 28). Why Deep Learning Is a Perfect Match for Natural Language Processing. https://www.appier.com/en/blog/why-deep-learning-is-a-perfect-match-for-natural-language-processing
Çetin, M. S. (2021). Yapay Zeka Teknolojilerinin Hukuki İşlem Teorisine Etkileri (1. Baskı). On İki Levha Yayıncılık A.Ş.
Dayan, A., & Yılmaz, A. (2022). Doğal dil işleme ve derin öğrenme algoritmaları ile makine dili modellemesi. Dicle University Journal of Engineering), 467–475.
Malik, R. S. (2022, Temmuz 21). The 4 Language Processing Techniques You Should Know How To Use. Medium. https://medium.datadriveninvestor.com/the-4-language-processing-techniques-you-should-know-how-to-use-821605cc9254