Farkedildiği üzere web çok büyüdü. Çok fazla veri bulunmakta ve bunları takip etmek zorlaştı. Anlamlar aynı aslında ve verinin makinelerce anlaşılabilirliği yok.

Arama motorları da bilindiği gibi kelime tabanlı çalışmaktadır. Bize direk bilgiyi vermeyip o bilgiye sahip siteleri veriyorlar. İnsanlar da burada aradıkları bilgiyi kendileri yorumluyor ve buluyorlar.

Kısaca Google‘ın kelime tabanlı olmasının sorunlarından bahsedecek olursak;

  1. Bize soruların tam cevabını veremiyor. Link sunuyor ve yine bunları birleştirip insan anlıyor. Soruların direk cevabını verebilmesi için kelimeleri anlaması lazım. Başka makineye de bunu nereden bulucaz diye soramıyor.
  2. Türkçe bir soru yazdığımızda sadece Türkçe verilerde arama yapıyor. Ama belki bizim aradığımız cevap Almanca bir sitede bulunmakta.
  3. Web tabanlı uygulamalar farklı teknoloji, yöntemler, iletişim protokolleri vb. kullanıyorlar. Burada da “iki yazılımı nasıl birleştiricez?” sorusu çıkıyor.

Mesela arama motoruna “lüfer balığı” yazdığımızda 1000 tane sonuç çıkmaktadır. Bu sonuçların çoğu anlamsız belkide. Görüldüğü gibi sözlüğe, kelimelere çok bağımlıyız. Oysa ki İngilizce de belki de tam aradığımız bilgi bulunmakta. Yukarıda da bahsettiğim gibi web sitelerindeki bilgiye ulaşmak için insan beynine ihtiyaç duyuluyor. Yani ne dediğimizi anlamaya çalışmıyor kelime tabanlı arama motorları.

Şimdi şöyle bir örneğe bakalım;

I am a professor of Computer Science.

I am a professor of Computer Science, you may think. Well, …

Yukarıda iki farklı cümle bulunmaktadır. İkisi de farklı kişidir ve ikisi de computer science değildir. Fakat bu iki cümle arasındaki farkı kelime tabanlılar anlamazlar. Bizim de anlamdan kastımız, bilgisayarın ikinci cümledeki kişinin profesör olmadığını anlaması.

İşte Semantic Web diyor ki; artık verileri kelime tabanlı değilde anlamsal tutalım ve bu verileri makineler yorumlayabilsin. Sıfırdan yeni bir web değil bu. Var olan verilerin kullanıldığı web‘e denilir.

Çok fazla veri olduğu için bunun yönetiminin zorlaştığından bahsetmiştim. İşte tam bu noktada bilginin yönetilmesi(Knowledge Management) kavramı ortaya çıkıyor. Bu kavramda dörte ayrılmaktadır:

  1. Searching Information
  2. Extracting Information
  3. Maintaining Information
  4. Using Information

Bunların detaylarına girmeyeceğim.

Şimdi de elektronik ticaret konusunu bir düşünelim. Mesela ben avı çok seven biri olayım ve av için bir şeyler almak isteyeyim. Web de bunu arattığımda çok fazla av sitesi olduğundan hepsine bakmam lazım. Fakat bu şekilde hepsine bakmak da zaman alıyor. Yani mümkün değil, hepsine bakamam. Bunun için de shopbots üretilmiş.

Shopbots, sitelerden var olan ürünleri çekiyor ve kategorilendiriyor. Bu takip işlemini wrapperlar yapıyor. HTML kodlarını periyodik olarak çekiyorlar ve tüm wrapperlar bunları birleştirerek sonuç shopbots da gösteriliyor. Fakat burada da sıkıntı var. Çok güvenilir olmamakla birlikte wrapperların yazımı zor. Hadi yazıldı diyelim, bu seferde yazıldığı web sitesine bağımlılığını test etmesi zor. Ayrıca wrapperlarda elde edilen veri de text verisi. Anlamlandırabilmek için işlem yapmak lazım. Bu yüzden bu da tam da sonuç vermiyor.

Bu bilgiler doğrultusunda “Semantic Web nedir?” diye kısa bir özet geçmek gerekirse; verilerin anlamlı bir şekilde tutulması ve bu tutulan anlamlı verilerin makineler tarafından işlenip bunu anlamlandırabilmesi. Yani biz web de herhangi bir şey aradığımızda bize o aramanın cevabını linkler halinde verip de “Bundan sonrasını da sen bul artık arkadaş. 😀 ” demesinde hangi dilde olursa olsun kesin cevabını göstersin.

Bunlar ontolojinin temel bilgileriydi. Bundan sonraki yazımda XML’i anlatacağım. Umarım anlaşılır bir yazı olmuştur. “Anlamlı” çalışmalar. 🙂

610 Total Views 2 Views Today
Share on FacebookTweet about this on TwitterShare on Google+Share on LinkedIn