Hukuk Alanında Yapay Zeka ve Tahmin Hatası

Her geçen gün Yapay Zekanın farklı uygulama alanlarında örnekleriyle karşılaşıyoruz. Bu alanlardan biri de elbette ki hukuk. Bu yazıda hukuk alanında yapay zekanın kullanımına örnekler vermektense, farklı bir bakış açısı ile Yapay Zeka’nın, aslen bir karar alıcı değil bir tahmin edici olmasından yola çıkarak bir Yapay Zeka sisteminin hukuk alanında kullanılması durumunda göz önünde bulundurulması gereken algoritmik yanılgılar ve kullanılan Yapay Zekanın Manipüle edilebilirliği konularına değinilecektir.

Yapay Zeka Tahmin Hatası: Algoritmik Önyargı

Tahmin hatasının yanında literatürde Algoritmik Önyargı olarak da ifade edilen ve aslen tahmin hatasının bir sonuçlarından birisi olan, Yapay Zekanın eğitilmesinde kullanılan veri setlerinin niteliklerine bağlı olarak Yapay Zeka tarafından gerçekleştirilecek tahinler üzerinde de veri setinin belirli özellikleri itibariyle yoğunlaşmaların olması konusunda açıklamalar yapılacaktır.

İster bir tahmin hatası olsun, isterse de bu tahmin hatası algoritmik bir ön yargı olarak isimlendiriliyor olsun her halükarda bir Yapay Zeka Modeli tarafından verilecek kararların, her bir karar için yüzde yüz doğru olduğuna güvenmek mümkün olmayacaktır.

Bir Yapay Zeka Modelinin aldığı kararlar ile bir insanın aldığı kararlar arasındaki hatalar elbette ki karşılaştırılabilir verilerdir ancak bu yazının konusu değildir.

Hukuki açıdan her ne kadar herkesin kanun önünde eşit olsa da yapay zeka alanında öğrenmenin geçmiş deneyimlere bağlılığı, tahmin hatası istatistiki değerlerin bir yansıması olarak her zaman karşımıza çıkaracaktır.

Matematiksel Yaklaşım

Matematik dilinde hiç düşünmeden uygulanan yöntemlere algoritma denir. Matematiksel açıdan algoritma bir fonksiyon olarak da düşünülebilir.

Bilgisayar programcılığı açısından ise algoritma, bir problemin çözümünde izlenecek yol olarak tanımlanabilir.

Örneğin f(x) = x2 şeklinde tanımlanan bir fonksiyon, algoritmik anlamda girdisi olan her değerin karesini hesaplamak üzere tanımlanmış bir algoritmadır. Ancak, algoritmalar her zaman doğru sonuca ulaşmazlar.

Matematiksel açıdan baktığımızda, X ve Y iki küme olmak üzere, X’in her bir öğesini Y’nin bir tek öğesini iliştiren kurala X’ ten Y’ ye giden bir fonksiyon denilmektedir.

Bu halde anlaşılması gereken bir diğer kavram ise kümedir.

Kümeler teorisine göre tüm değerleri içerisine alan bir evrensel küme (E) ve bu evrensel kümenin alt kümelerinden bahsetmemiz gerekecektir. X ve Y kümeleri de bu E kümesinin bir alt kümesi olacaktır.

Bu denklemi hukuksal açıdan ele aldığımızda ise, E kümesi (tüm insanlar) içerisinde X kümesi (şüpheli olan kişiler) ile Y kümesi (suçlu olduğu tespit edilenler) arasındaki ilişkiyi tespit eden F(x) fonksiyonu için yargılama süreci tanımlamasını yapmak yanlış olmayacaktır.

Hukuk yargılama sürecine bir şüphelinin suçlu olup olmadığına ilişkin bir mantıksal önerme ile başlayacaktır.

Masumiyet karinesi gereği olarak bu hipotez “Şüpheli suçsuzdur” ifadesi ile kurularak hipotezin reddini, yani kişinin suçlu olduğunu kesin ve şüpheden uzak bir şekilde ispata yetecek miktarda delil olup olmadığını araştırılır.

Yani, hipotez, aksi ispat edilinceye kadar doğru kabul edilir.

Bu hipotez H0: “Şüpheli suçsuzdur” şeklinde ifade edilir ve bunun tümleyeni ise H1 hipotezleridir. H1 hipotezi ise en basit tanım ile şüphelinin suçlu olmasıdır.

Önermeler mantığı önermelerin kendilerini değil, doğruluk ve yanlışlık açısından aralarındaki ilişkiyi inceler. Önermeler mantığı matematiksel mantığın ilk konusudur. Önerme sözcüğü doğru ya da yanlış olabilecek tümce anlamına gelir.

Bu bakış açısı ile her hipotez bir önermedir. Çünkü her hipotezin bir doğru veya yanlış sonucu vardır. Hipotezin sınanması da önermenin doğruluğunun araştırılması olarak değerlendirilebilir.

Bir Adım Sonrası: Matematiksel Modeller

Hukuki sürecin matematiksel karşılığı olarak bir adım sonrasında matematiksel bir modelden bahsetmek yerinde olacaktır.

Matematiksel modeller, özelliği ve biçimi ne olursa olsun, değişkenlerin arasında ilişki kuran bir formata, yani karmaşık veya basit bir fonksiyon niteliğine sahiptir. Bu nedenle fonksiyon ve küme teorileri açısından ele alınması mümkündür.

İlişkiler, Tümdengelim ve Tümevarım

X değişkenindeki her değere karşılık, Y bağımlı değişkeni sadece bir ve belli bir değer alıyorsa, söz konusu ilişki deterministik(kesin) ilişkidir.

X değişkenindeki her değere karşılık, Y bağımlı değişkeni olasılıklar dâhilinde farklı değerler alabiliyorsa bu da stokastik (rastlantısal) ilişkidir. Y’ nin alabildiği değerler aralığı ise sapma olarak ifade edilir.

Şüpheli suçsuzdur hipotezimiz açısından bu durumu değerlendirdiğimizde, kesin ve şüpheden uzak bir tespit ile kişinin suçlu olduğuna karar verebilmek için deterministik bir ilişkinin tespit edilmiş olması masumiyet karinesinin gereğidir.

X ve Y arasındaki deterministik ilişkinin her X için yalnızca bir Y’ nin bulunması durumunda ise matematiksel bir kuramdan bahsedebilmek mümkün olacaktır.

Matematiksel modeller temelde tümevarım (endüksiyon), tümdengelim (dedüksiyon) ve analojik (benzeşim) yaklaşımlarla elde edilmektedir.

Tümevarımsal modellerde, parçadan bütüne doğru akıl yürütülür. Bir çıkarım değil, varım söz konusudur, çünkü sonuç içerik bakımından parçalardan elde edilmiş yeni ve daha fazla bilgidir. Deney ve gözlemler sonucu elde edilen sonuçlar tümevarıma iyi örneklerdir. Ancak en önemli özelliği bir sonuca ulaşma zorunluluğunun olmamasıdır.

Tümdengelimsel modeller, sonucun parçalara bağlı olarak zorunlu olarak ortaya çıktığı bütünden parçalara doğru bir akıl yürütme biçimidir. Bu yöntem bilineni artırmaktan ziyade bilinenin çözümlenmesine, anlaşılmasına yani bir çıkarımda bulunulmasına çalışılır.

Anolojik Modeller

Analojik modeller ise özelden özele, genelden genele bir akıl yürütme biçimidir. Tümevarımda olduğu gibi bir sonuca ulaşılması gerekli olmadığı gibi tümdengelimdeki sonucun parçalara bağımlılığı da söz konusu değildir. Analojik akıl yürütmede elde edilmek istenen parçaların ortak özelliklerine bağlı olarak elde edilen sonucun da daha doğru olma olasılığını artırmaktır.

Buraya kadar yazılanları özetleyecek olursak, bir fonksiyon veya bir algoritma, mantıksal bir önermeyi doğrulama amacı taşıyabilir ve bu durum küme teorisine aykırılık teşkil etmeyecektir. Hatta neticede matematiksel bir model hatta matematiksel bir kuram elde etmek bile mümkün olabilir.

Suç İsnadı

Buradaki sakınca en uç seviyede ulaşılabilecek matematiksel kuramın, tümevarımsal akıl yürütme biçimi ile yargı süreci içerisinde şüpheli sıfatı taşıyan kişinin kanunda suç olarak tanımlanmış eylemi gerçekleştirmiş olmasını hakimin değerlendirmesinden ayırarak mekanik bir şekilde cezalandırma yoluna gidecektir. Benzer şekilde tümdengelimsel akıl yürütmede ise suç olarak tanımlanan bir eylemin gerçekleşmesi durumunda eylemle ilişkisi şüphe seviyesinde olan bir kişinin dahi cezalandırılması gerekecektir.

Analojik akıl yürütme açısından bakıldığında ise, parçadan parçaya akıl yürütme süreci, hukukun delilleri ayrı ayrı değerlendirerek ulaşılabilecek matematiksel kuramın birbirinden bağımsız birden fazla ilişki (X’ den Y’ ye fonksiyonlar) olarak tanımlanmasını ve ulaşılacak sonuç açısından hakimin vicdani kanaatini kullanabileceği bir seçeneği sunabilmektedir. Ancak analojik akıl yürütmenin parçaların ortak özelliklerine bağlı olarak benzer sonuçlar elde edilmesini öngörmesinden dolayı bu yaklaşımda da elde edilecek sonuçların parçaların benzerliğine bağlı olarak ön yargısız olması mümkün olmayacaktır.

YAPAY ZEKA YAKLAŞIMI

Analojik akıl yürütmenin bilgisayarlar tarafından uygulanması söz konusu ise yapay zeka, makine öğrenmesi ve derin öğrenme konularından bahsetmek gerekecektir.

Literatürde sıklıkla birbirinden farklı yöntemler kullanan bu kavramların yapay zeka başlığı altında birbirlerinin yerine kullanıldığı hatta hukukun doğrudan ilgili olmadığı bir alan olması nedeni ile olsa gerek bir kısım kaynakta hatalı kullanımların dahi mevcut olduğu görülmüştür.

Kaynak: https://fintechistanbul.org/2018/03/12/makine-ogrenmesi-uzerine/

John McCarthy, yapay zekayı 1955 yılında “insanlar gibi hedeflere ulaşma becerisine sahip olan akıllı makineler üretme bilimi ve mühendisliği” olarak tanımlamıştır.

Makine öğrenmesi, yapay zekanın bir alt kümesi olarak mevcut veriler çerçevesinde bir makine öğrenme algoritmasının kullanılarak eğitilen modelin, yeni veriler için tahminlerde bulunmasında sağlamak için kullanılırken, makine öğrenmesinin bir alt dalı olan derin öğrenme modellerinde yapay sinir ağları kullanılarak, model eğitim süreci içerisinde ve sonrasında kendi kendine öğrenmeye başlamaktadır.

Yani kısaca Yapay Zeka olarak isimlendirdiğimiz yapılar Makine Öğrenmesi Algoritmaları veya bir Makine Öğrenmesi Algoritmalarından birisi olan bir Derin Öğrenme algoritmasıdır.

Kaynak: https://docs.microsoft.com/tr-tr/azure/machine-learning/concept-deep-learning-vs-machine-learning

Veri işleme ve eğitim yöntemlerinin oldukça farklı olması nedeni ile Derin Öğrenme Algoritmalarının, diğer Makine Öğrenmesi Algoritmalarından farklı bir yöntem olarak düşünülmesi yanlış olmayacaktır.

Bu yazı içerisinde her ne kadar Derin Öğrenme, Makine Öğrenmesinin bir alt alanı olsa da, Derin Öğrenme ve diğer Makine Öğrenmesi Algoritmalarının (yapay sinir ağları kullanmayan) yaklaşımları karşılaştırıldığı için diğer Makine Öğrenmesi olarak ifade edilmiştir.

Makine Öğrenmesi

Makine öğrenmesinde eldeki mevcut veriler ile bir eğitim algoritmasının kullanılarak eğitilmiş bir model elde edilmesi söz konusudur.

Hukuk alanı açısından baktığımızda eldeki verilerin hukuki metinler olması gerekeceği açıktır. Metinsel verilerden bir model oluşturma işlemi Doğal Dil İşleme olarak isimlendirilmektedir.

Bir metnin Doğal Dil İşleme sürecine alınmadan önce, elde edilmek istenen model açısından anlamsız olan noktalama işaretleri, durak kelimeler ve benzeri unsurlarda arındırıldığı bir ön işleme sürecine tabi tutulması gerekmektedir.

Sonrasında elde edilen veri bütününe Eğitim Seti demek doğru olacaktır. Eğitim setinin hazırlanması sonrasında amaca uygun bir veri işleme algoritması seçilmelidir.

Makine Öğrenmesi alanında Doğal Dil İşleme İçin kullanılan TF-IDF, Word2Vec, GloVe, LDA2vec ve Facebook tarafından da kullanılan ve benim de Veri Bilimi Alanı Yüksek Lisansımda kullandığım FastText gibi çeşitli algoritmalar bulunmaktadır [1].

Burada derin öğrenme ile ayrışan nokta, veri setinin belirli özellikleri itibariyle sınıflandırılabilir olmasıdır.

Algoritmaların amacı genel bir ifadeyle, hazırlanan veri setini bilgisayarın anlayabileceği sayısal verilere dönüştürmektir. Bu dönüştürme işlemi sonrasında elde edilen ve eğitilmiş model olarak ifade edilen yapı bir kelime vektör uzayıdır.

Eğitim veri seti içerisinde, seçilen kelime büyüklüğüne bağlı olarak kelimelerin vektör karşılıkları ve vektör uzayı içerisindeki birbirlerine göre olan konumları bir bilgisayar açısından öğrenme olarak ifade edilebilir.

Makine öğrenmesi açısından sonraki adım yeni bir verinin, yani metnin bu vektör uzayı içerisindeki yerini bularak bulunan konumun doğruluğunu tahmin etmek olacaktır.

Modelin yeterince doğru tahminlerde bulunup bulunmadığını anlayabilmek için, veri seti içerisindeki metinleri eğitilmiş modelin girdileri olarak kullanıp, model tahmini ile metnin ait oldukları sınıfları karşılaştırmak gerekecektir.

Makine öğrenmesi modellerinin tahmin doğruluğu, veri setinin sahip olduğu sınıflardan eşit sayıda metin ile eğitilmiş olmalarına bağlıdır. Ancak her halükarda bir makine öğrenmesi modelinden %100 doğru tahminlerde bulunması beklenmez. Çünkü düşük doğruluğa sahip tahminlerin kullanılabilir olmadığı gibi çok yüksek doğruluk orana sahip tahminlerde modelin aşırı öğrenme yani ezberleme problemi ile karşılaştığı, yani istisnai durumlar karşısında doğru tahminde bulunamayacağı anlamına gelecektir.

Ancak elde edilen sonuçlar itibariyle tahmin doğruluğunun belirli bir değerin üzerine çıkmaması tercih edilmesinden dolayı, sonucun bir ayrım kriteri olarak değil, tahmin oranı olarak kullanılması ve pozitif ve negatif yönlü eşik değerler ve ara değerlerin en az üçe bölünmüş olarak ele alınması gerekecektir.

Hukuk açısından bunun anlamı, bir makine öğrenmesi modelinin bir kişinin yargılama sonrasında suçlu olduğuna dair bir karar veremeyeceği ancak suçlu olabileceği yönünde oransal bir tahminde bulunabileceğidir. Ancak elbette model açısından %90 oranında bir tahmin doğruluğunun yeterli görülmesi, bu oran üzerindeki tahminler için suçlu kararını vermesi de parametrik olarak mümkündür.

Elbette bu durum, suçun kesin ve şüpheden uzak bir şekilde ispatlanması ilkesi açısından uygulamada doğru bir yöntem olmayacağı da açıktır.

Diğer taraftan aşırı öğrenme tam olarak bir tahmin hatası olarak değerlendirilemese de, elde edilen sonuçlar itibariyle istisnai durumlarda bir hata, tahmin doğruluğunun oransal bir değer olması ise hukuki açından bir kesinlik niteliği taşımayacaktır.

Derin Öğrenme

Derin öğrenme Makine öğrenmesinde farklı olarak bir veri seti içerisindeki metinlerin, sırası ile bir yapay sinir ağına girdi olarak verilmesi ve eğitim süreci içerisinde giriş ve çıkış katmanlarına ek olarak gizli katman olarak isimlendirilen ve sinir ağı düğümlerinden oluşan yapı içerisinde, her bir düğüm ağırlığını girdi verilerine göre kendisi belirleyerek ve bu girdi ağırlıklarını yeni girdilere bağlı olarak değiştirerek kendi kendine öğrenen bir yapıdır.

Bu özelliği ile bir derin öğrenme modelinin eğitim süreci sürekliliğe sahip olabileceği gibi, yeterince öğrendiğine, yani istenen doğrulukta sonuç üreten bir derin öğrenme modelinde girdilerin yalnızca kendisini etkileyen ağırlıklandırma sonrasında tekrar orijinal hali ile kullanımı mümkündür.

Aslında bu durum modelin tutarlılığı açısından zorunludur da çünkü, daha önce girdi olarak kullanılan bir metnin eğitim sürecinin sonraki aşamalarında tekrar kullanılması durumunda farklı bir sonuç elde etmek mümkün olacaktır.

Bir derin öğrenme modelinden beklenen, eğitim süreci sonunda, veri seti içerisindeki örüntüleri kendi kendisine tanımlayarak bir tahmin seti içerisinden bir seçim yapmasıdır. Yapay sinir ağır girdilere bağlı olarak ağırlıkları kendisi hesaplamakta yani girdilerin sonuç üzerine etkisine kendisi karar vermektedir. Ancak bias (yanlılık) olarak ifade edilen ve girdiler ile birlikte ele alınan değer, bir hücrenin nihai sonuç üzerindeki etkisini değiştirebilmeyi sağlamaktadır.

Kaynak: https://www.veribilimiokulu.com/yapay-sinir-aglari/

Bu parametre elbette algoritmik olarak modelin kendi belirlediği bir değer olarak düşünülebileceği gibi, modelin optimizasyonunu sağlama amacı ile kullanılan, yani hukuki açından bakılacak olursa, derin öğrenme ile karar veren bir modelde hakimin sonucu yani çıktıyı etkileyebilecek vicdani kanaati olarak değerlendirilebilecek bir parametre olarak da düşünülebilir.

Derin öğrenmedeki tahmin hatasının, derin öğrenmenin girdileri kendisinin ağırlıklandırmasına bağlı olacağı aşikardır. Örneğin, erkeklerin kadınlardan daha fazla suç işlediğine dair verilerin olduğu bir veri seti ile modelin eğitilmesi durumunda erkek/kadın girdisine bağlı olarak erkekler için ulaşılacak ağırlığın da daha fazla olacaktır.

Erkek kadın, yaşlı/genç veya belirli bir kökene sahip olan kişilere ait verilerin model tarafından daha fazla ağırlandırılmış olmaları ise açıktır ki hukuk önündeki eşitlik ilkesi ile çelişecektir.

HUKUKTA KARAR ALICI BİR YAPAY ZEKANIN MANİPÜLE EDİLEBİLİRLİĞİ

Bir avukatın işinin hakimi kendi lehine karar alması için ikna etmek olduğu gibi, hukukta karar alıcı bir yapay zekanın da hangi yöntemi kullanırsa kullansın teknik olarak manipüle edilebilir olduğundan bahsedilebilir. Hatta belki de bu durum tahmin hatalarından daha sakıncalı olarak da değerlendirilebilir.

Kullanılan yöntemin makine öğrenmesine bağlı bir model üzerinde işletilmesi durumunda, avukatın savunma metinlerini ve delil sunumlarını, vektör uzayı içerisinde konumlandırma ve modelin tahmin oranını kendi lehine artırma amacı taşıyabileceği, derin öğrenmeye bağlı bir modelin işletilmesi durumunda ise aynı yöntemi bu sefer de girdi parametrelerinin ağırlıkları üzerinde etki etmeye yönelik kullanmaya çalışması muhtemel ve olağandır.

Ancak şunu belirtmek gerekir ki bir derin öğrenme modelini etkilemek bir makine öğrenmesi modelini etkilemekten çok daha zor olacaktır.

İlerleyen yıllarda hukuk alanında yapay zeka modellerinin kullanılmaya başlanması ile Avukatların da yollarının Veri Bilimciler ile kesişmesi gerekeceği çok açık.

“Teknoloji ve Yazılım” kategorisindeki tüm Blog yazılarımızı okumak için tıklayınız.

Yazarın 10. Sayımızdaki “Taşıyıcı Sınıf Ağ Adresi Çeviricileri (CGNAT) Kayıtlarının Delil Niteliği” isimli yazısını bağlantımızdan okuyabilirsiniz.  

Yazar: Dr. Berker KILIÇ / Adli Bilişim Uzmanı, Veri Bilimci

Kaynaklar

[1] KILIÇ B. & ÖNER Y. “Yargıtay Kararlarının Suç Türlerine Göre Makine Öğrenmesi Yöntemleri İle Sınıflandırılması” Veri Bilimi Dergisi, 4(3), 61-71, 2021.