Sosyal İşbirlikçi Filtreleme

Bu yıl üniversitede 4. yılım malum. Hal böyle olunca tez çalışması yapmak gerekti. Bende 1-2 yıl önceden belirlediğim konuda yapmaya karar verdim tezimi. O konu ise Tavsiye Sistemleri. Hem okuduğum bölüm olan istatistiği hemde ilgi alanım ve mesleğim gördüğüm yazılımı bir arada barındırıyordu. Bu yüzden seçmiştim bu konuyu. Hikayeyi bırakırsak sizlerle bu konuda öğrendiklerimin bir kısmını paylaşacağım.

Tavsiye Sistemleri ana başlığı altında kendime seçtiğim alan İşbirlikçi Filtreleme (collaborative filtering) oldu. Tavsiye sistemleri biraz daha geniş bir tanım. Öncelikle İşbirlikçi Filtreleme’yi araştırmakla başladım.

Peki nedir bu İşbirlikçi Filtreleme

İşbirlikçi Filtreleme, bazı öneri sistemlerini kullanan bir tekniktir[1]. İF  yaklaşımının altında yatan temel varsayım geçmişte kabul edilenlerin gelecekte de kabul edilebileceğidir[2]. İF genel olarak iki farklı biçimde uygulanır[3]. Bunlar

  • Öğe Bazlı (Item Based) İşbirlikçi Filtreleme
  • Kullanıcı Bazlı (User Based) İşbirlikçi Filtreleme

Kullanıcı bazlı filtrelemede kullanıcılar beğenileri ile karşılaştırılır ve kullanıcı için en yakın kullanıcı bulunarak onun diğer beğendikleri kullanıcıya önerilir. Öğe bazlı filtrelemede ise  bir öğe-öğe matrisi ile öğeler arası benzerlikler hesaplandıktan sonra o öğeyi beğenenlere benzer öğeler önerilir.

Bunu bir örnekle açıklamak gerekirse;

Öğe bazlı İşbirlikçi Filtreleme ile Kullanıcı bazlı İşbirlikçi Filtrelemenin karşılaştırılması

 

Şekildeki durumda, kullanıcı bazlı filtrelemede kullanıcılar eşleştirildiğinden 3. kullanıcıya üzüm ve portakal önerilirken öğe bazlı filtrelemede öğeler eşleştirildiğinden 3. Kullanıcıya yalnızca üzüm önerilir[4].

Genel olarak İF’nin sözel anlatımı bu kadar. Kafanızda birşeyler canlanmıştır. Birazda uygulama yapalımki iyice otursun kafalarda :).

Sosyal Ağlar yardımı ile İşbirlikçi Filtreleme

Uygulamayı anlaşılabilir olması açısından basit düzeyde tuttum. Amacımız bir kullanıcının beğendiği filmlere göre henüz beğenmediği ama beğenmesi yüksek olasılıklı filmleri önermek. Kullanıcı verileri için (örneğin kullanıcının beğendiği filmler) Facebook verilerini kullandım, bu sayede İF’nin ilk kullanıcı hakkında bilgi sahibi olmama (cold start) problemine de bir çözüm yolu getirmiş oldum. Önerilebilecek filmleri bulabilmek için ise hazır veritabanı kullanmak yerine ise gene Facebook verilerini kullandım. Önerilecek filmleri de kullanıcının arkadaşlarının beğendiği filmler üzerinden buluyor. Ayrıca bir bildiri için hazırlanan tez çalışmama da şuradan bakabilirsiniz.

Uygulamaya şu adresten ulaşabilirsiniz. Bu arada bu uygulamanın gelişmiş versiyonunu yeni projem olan Fragmanda sitesinde kullanacağım. Öğrendiklerimizi kullanmamız gerek, yoksa ne anlamı var değil mi? 🙂

Kaynaklar:

  1. http://en.wikipedia.org/wiki/Collaborative_filtering
  2. http://degiske.com/2010/10/10/isbirlikci-filtreleme
  3. http://ojs.academypublisher.com/index.php/jsw/article/viewFile/0507745752/1954
  4. http://cuihelei.blogspot.com/2012/09/the-difference-among-three.html

MongoDB ve Node.JS nedir?

Uzun bir aradan sonra merhaba. Geçen gün Google Developer Group İstanbul ekibinin hazırladığı, 2013’ün ilk konferansı olan “Merhaba 2013” için İTÜ Ayazağa kampüsündeydim. Ve öğrendiklerimi (gene not alma fırsatım olmadığından) hatırladığım kadarıyla paylaşmak istedim. Yazmadığım dönemde katıldığım başka konferanslarda oldu ancak onlarla ilgili sizinle paylaşabileceğim bir şey bulamadığımdan yazmadım (diyerek sürekli konferanslara gittiğim imasındada bulunmuş olayım 🙂 ). Neyse geçelim konumuza.

Bugün benim katıldığım oturumlardaki konu MongoDB ve Node.JS idi. Uzun zamandır duyuyordum bu kelimeleri. Ve anlamını bilmediğim bir kelime olarak havada kalıyordu. Bugün gitme amacım tamamen öğrenmek olmasada, bu kelimelerin içini doldurmaktı. Amacıma da ulaştım. Sizlere de kulak aşinalığı olması açısından dilim döndüğünce anlatacağım.

İlk olarak öğrendiğim sırayla gidersem, MongoDB ile başlayalım.

Nedir MongoDB?

MongoDB ilişkisel olmayan yani NoSQL veritabanı. Peki ne demek bu ilişkisel olmayan? Yani düşününki veritabanı var, ama içinde ne tablo var, ne transactions (select,insert,update,delete gibi işlemler) var. Peki nasıl oluyor bu iş derseniz şöyleki, MongoDB’yi benim anladığım JSON formatında verileri Array(dizi) olarak tutan bir veritabanı olarak düşünebiliriz. Yani bildiğimiz JSON formatı olduğu için çekilen verileri JSON teknikleri ile sayfaya dökebiliyoruz. Peki neden MongoDB derseniz, en önemli sebep kesinlikle HIZ. Popüler Big Data (Büyük Veri) işlemlerde büyük hız avantajı sağlıyor. Hız isteyenler ve büyük veriyle çalışanlar kesinlikle geçmeli yani. Bu bana MS Access’ten MySQL’e geçtiğim zamanı hatırlattı. Zamanında Access yeterliyken, internet hızlandıkça, veriler arttı, bu oldukça da Access yetmemeye başladı, ve Mysql’e geçildi. Aynı süreç henüz gerekmesede ileride MongoDB için yaşanabilir. Bunu ancak zaman gösterecek.

İkinci olarakta NodeJS ile devam edelim.

Nedir Node.js?

Node.JS sunucu tarafında çalışan(server-side) bir framework. Yani bir programlama dili değil. Amacı bir nevi sunucuda JS çalıştırmak. Bunu örnekle açıklarsam daha kolay olacak sanırım. Örneğin siz bir javascript kodu koyduğunuzda sitenize, kullanıcı sitenize girer ve tarayıcısı destekliyor ise o JS kodu çalışır ve işlemler gerçekleşir. Node.JS ise bunu sunucu tarafında yaparak kullanıcının Tarayıcısından bağımsız çalışmasını sağlıyor. PHP nasıl siteye her giren için aynı sonucu veriyor, sunucu üzerinde yorumlanıp sonuç herkese aynı sunuluyor ise buda öyle birşey. Bu sayede HTML5 ile dahada önem kazanan JS herkeste sorunsuz çalışır hale gelmiş oluyor. Node.JS’in bir diğer büyük avantajı ise HIZ. Apache, ISS vs gerektirmiyor. Node.JS kurduktan sonra, 3-4 satır kod ile HTTP server haline getirebiliyorsunuz bilgisayarınızı veya sunucunuzu.

Dikkatinizi çektiyse iki yeni teknolojide de HIZ vurgusunu yaptım. Etkinlikte söylendiğine göre LinkedIn son tasarım değiştirdiğinde aynı zamanda Node.JS ve MongoDB ikilisine geçiş yapmış, trafiği 2 kat artmasına rağmen sayfa açılış hızı ise 5 kat artmış. Bu muhteşem bir fark.

Genel olarak paylaşmak istediklerim, aklıma gelenler bu kadar şimdilik. Daha detaylı bilgiler için MongoDB ve Node.JS sunumunda kullanılan sunulara şuradan ulaşabilirsiniz.