Ana içeriğe atla →

Bing üzerindenGPT4 kullanarak fotoğraf betimlemesi alma

Biz görme engellilerin en büyük sorunlarından biri de bir fotoğraftaki görselleri algılamak oluyordu. Önceleri nesne tanıma uygulamalarıyla bu problemi bir miktar aşmış olsak da bu uygulamalar bizlere resimlerdeki belirgin birkaç nesneyi belirtiyordu. Hal böyle olunca bizler de gören birinden yardım almak durumunda kalıyorduk.

Yakın zamanda kullanıma sunulan uygulamalar ise görsel tanımada çıtayı biraz daha yükseltmişlerdi. From Your Eyes uygulamasıysa kendi yapay zeka modelini geliştirerek bizlerin görselleri algılamamızda ve fotoğraflarımızı betimletebilmemizde rehberimiz olmaya başladı. Fakat Be My Eyes uygulamasının geliştiricileri bu yılın bahar aylarında Open AI ile işbirliğine giderek dünyaca kabul görmüş GPT 4 yapay zeka dil modelini uygulamaya entegre ederek fotoğraf betimlemelerine başlayacaklarını duyurunca görme engelliler camiasında büyük bir heyecan uyandırmayı başardılar. Bu güzel gelişmeye dair beta testleri iOS kullanıcılarına açıldı fakat Android kullanıcısı görme engelliler GPT 4 yapay zeka dil modelinden detaylı fotoğraf betimlemesi alabilmek için birkaç ay daha beklemek durumundaydılar.

Ta ki Microsoft da Open AI firmasıyla işbirliğine giderek GPT 4’ü Bing arama motoruna entegre edene kadar…
Görme engelliler de artık Bing’i kullanarak çok detaylı fotoğraf betimlemeleri alabiliyorlar.

Bing’den nasıl fotoğraf betimlemesi alınır?

  • Bing uygulamasını Google Play Store üzerinden indirip Microsoft hesabımızla oturum açtıktan sonra alt satırda bulunan Sohbet sekmesine geliyoruz.
  • Burada Bing’e sor metin alanına odaklandıktan sonra sağ fiske hareketiyle “Aramak için bir resim ekleyin” butonuna dokunuyoruz. Kameramız açılacaktır. Bu aşamada istersek bir fotoğraf çekebiliriz. Şayet galerimizdeki bir fotoğrafın betimlemesini almak istiyorsak ekran okuyucumuzu “Fotoğraf çek” butonuna odakladıktan sonra bir sol fiske hareketi yaparak galerimizi açma butonuna ulaşabiliyoruz.
  • Galerimiz açılıp fotoğrafımızı seçtikten sonra tekrar “Bing’e sor” metin alanına gelip “Bu fotoğrafı benim için betimler misin?” gibi bir soru soruyoruz ve Gönder butonuna dokunuyoruz.
  • Bu aşamada fotoğrafımız gerekli sunucuya gönderilip analizi yapılıncaya kadar bir dakika civarı beklememiz gerekebiliyor. Bu beklemenin sonunda gören bir arkadaşımızın bizim için yapabileceği kadar doğru, tutarlı ve gerçekçi bir betimleme elde edebiliyoruz. Gönderdiğimiz fotoğrafla ilgili merak ettiğimiz başka bir husus olursa özel olarak onu da sorup öğrenebiliyoruz.

Ben ilk denememde, bir arkadaşımla akşam vakti bir parkta katlanır sandalyelerimizde oturur vaziyette çekildiğimiz bir fotoğrafı göndermiştim. Aldığım betimlemede parktaki çimenlerde arkamızdaki alanın ışıklandırmasına, oturduğumuz sandalyelerin nasıl olduğundan üzerimizdeki kıyafetlerin renk ve modeline kadar çok detaylı ve yüzde yüz doğru bir betimlemeyi görünce gerçekten çok şaşırdım.

Bing üzerindenGPT4 kullanarak fotoğraf betimlemesi alma videosu

Görüntüleme: 1.640

Yazar Hakkında

Hasan Çimen

Kategori: İpuçları

Yorumlar

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir