Kör Android kullanıcılarının, kendilerine özel olarak geliştirilen uygulamaların öncelikle veya özel olarak iOS’ta kullanılabilir olduğuna ve yeni özelliklerin sürekli olarak Android’den önce iOS’a geldiğine tanık olması alışılmadık bir durum değil. Bunların arasında Microsoft’un Seeing AI'ı de vardı a>, başlangıçta iOS kullanıcılarına özeldi. Ancak yıllar sonra uygulama nihayet Android’de kullanıma sunuldu. Bazıları onun gelişinin geciktiğini ve rekabet açısından pek bir şey sunmadığını düşünse de Seeing AI, platformdaki ilk gününden itibaren kendisini görme engellilere yönelik ilgi çekici Android uygulamalarından biri olarak kabul ettirmeyi başardı.
Uygulamayı test etmeye başladığım andan itibaren beni etkiledi. Seeing AI konusunda beni heyecanlandıran nedenleri ve bunu neden kayda değer bir gelişme olarak gördüğümü burada bulabilirsiniz.
Belge Okuma:
Çok sayıda Android uygulaması metni oldukça iyi tanıyabildiği halde Seeing AI, yalnızca 2 sayfalık testlerim sırasında olağanüstü metin tanıma yetenekleri sergiledi. Uygulama, sayfanın görünmeyen kısımları konusunda kullanıcıları yönlendirerek sayfanın tamamının yakalanmasını kolaylaştırıyor. Tüm kenarlar görünür hale geldiğinde uygulama, kullanıcılardan sabit durmalarını istiyor ve otomatik olarak fotoğrafı çekiyor; bu da testlerimde doğru sonuçların elde etmemi sağladı.
Seing AI’yi diğerlerinden ayıran şey, tanınan metinle ilgili sorgulara yanıt verme kapasitesidir. Sayfanın konusunu ve ‘r’ harfinin metindeki sıklığını sordum ve yanıtlar aldım. Ayrıca taramaya başka bir sayfa ekleyebilir veya aynı sayfayı yeniden tarayabilirsiniz. Paylaşırken, çıkarılan metni veya orijinal resmi paylaşma seçeneğiniz vardır.
Uygulama ayrıca, metni kamera görünümünde göründüğü gibi anında okuyan kısa bir metin okuma özelliğine de sahiptir.
Ayrıntılı Resim Açıklaması:
Ayrıntılı görüntü tanımaya erişmek için, “sahne önizleme” özelliğini kullanarak uygulamanın içeriğini açıklamak üzere bir fotoğraf çekme veya açıklama için bir görüntüyü doğrudan uygulamayla paylaşma seçeneğiniz var. Başlangıçta basit bir kısa açıklama alırsınız, ancak “daha fazla bilgi”ye dokunduğunuzda yapay zeka tarafından desteklenen daha ayrıntılı bir açıklama sunulur. Tanıma performansı oldukça iyi; Sonuçlar hızlı bir şekilde ulaşıyor ve nesnelerin ve kişilerin ayrıntılarını ve açıklamalarını sunuyor. Ancak Bing Chat’te kullanılan GPT modeliyle karşılaştırıldığında Seeing AI’nin açıklamaları bazen geride kalıyor. Temel fotoğraflarda iyi performans gösterse de örneğin hem Bard hem de Bing Chat’in daha önce tanımladığı bir Lego yapısını tanımakta zorlandı.
İlgi çekici bir ekleme, kullanıcıların parmaklarını ekranda hareket ettirmesine ve altındaki nesneleri duymasına olanak tanıyan “keşfet” seçeneği; bu, görme engelli bireylerin resimde tasvir edilen sahneyi hayal etmelerine olanak sağlıyor.
Mevcut tüm görüntü tanıma hizmetlerinde olduğu gibi, zaman zaman ortaya çıkabilecek yanlışlıklar ve halüsinasyonlara karşı dikkatli olunması gerekmektedir. Yetersiz aydınlatılmış bir odada rastgele bir fotoğraf çektiğimde bu açıkça ortaya çıktı.Yapay zekanın eşyalar ve oda hakkında birkaç sahte ayrıntı ürettiği yer. Ayrıca gerçek görseli başkalarıyla da paylaşabileceğinizi unutmayın; bu kullanışlı bir özelliktir.
Tanınan resim içeriği hakkında takip soruları sorma olanağının şimdilik mevcut olmadığını belirtmek önemlidir.
Ürün Kimliği:
Bazı görme engelli kullanıcılar için çok önemli bir özellik, ürünleri ve paketleri tanımlamak için barkod taramayı kullanmaktır ve Seeing AI bu açıdan da öne çıkmaktadır. Popüler bir hazır erişte markası, bir makarna markası ve mayonez gibi çeşitli ürünleri, “ürün” kanalı üzerinden erişilen barkod taraması yoluyla etkili bir şekilde tanıdı. Bir barkod ararken uygulama, koda yakınlığı belirtmek için bip seslerini kullanır; bu, birçok pakette kolayca bulunabilen kodlar bulunmadığından özellikle faydalıdır. Koda yaklaştıkça bip seslerinin yoğunluğu ve hızı artar. Kod tespit edildikten sonra otomatik olarak yakalanır ve ilgili bilgiler görüntülenir.
Lookout’tan farklı olarak Seeing AI, ülkenizde mevcut olan ürünlere özel, etkili bir tanınma elde etmek için indirilmesi gereken ürün veritabanının kafa karıştırıcı manuel seçimini gerektirmez.
Kolay Arayüz:
Bireysel özelliklerin çoğu benzersiz olmasa da Seeing AI, tüm bu işlevleri erişilebilir ve basit bir şekilde görüntüler. Uygulamanın arayüzü basit olup, kullanıcılar için işleri karmaşık hale getirmeden, mevcut özelliklerin kolayca gezinilmesini ve keşfedilmesini sağlar. Ek olarak kullanıcılar, uygulama içindeki özelliklerin veya “kanalların” sırasını özelleştirme seçeneğine de sahiptir. Bu özelleştirme, ana ekranda veya uygulamalar listesinde uygulamanın adına uzun basıldığında görünen kısayolları belirtmeyi de kapsayacak şekilde genişletilerek, önce uygulamayı açmaya gerek kalmadan istenen özelliklere hızlı erişime olanak tanır.
Her Şeyi Açıklayan Yardım:
Seeing AI, video gösterimleri de dahil olmak üzere neredeyse her özellik için kapsamlı yardım sunuyor. Bu yaklaşım, yeni kullanıcıların yazılı veya sesli eğitimleri dışarıdan arama ihtiyacını ortadan kaldırıyor. Bunun yerine kullanıcılar, uygulamanın çeşitli özellikleri arasında sorunsuz bir şekilde gezinmek için uygulama içi eğitimlere güvenebilirler.
Bahsetmeye Değer Mevcut Sınırlamalar:
Seeing AI çeşitli açılardan üstün olsa da bazı sınırlamaları var:
- Uygulama, Envision gibi rakiplerle karşılaştırıldığında OCR tanıma açısından sınırlı sayıda dili desteklemektedir. Ayrıca para birimi okuyucu özelliği sınırlı sayıda desteklenen para birimine sahiptir.
- Işık algılama özelliğinde uygulama, ortamınızdaki ışık miktarını iletmek için ses tonlarını kullanır. Metin bilgilerinin ses tonlarıyla birleştirilmesi, yalnızca işitsel ipuçlarına güvenmekten rahatsız olan kullanıcılar için faydalı olacaktır.
- Yüz tanıma özelliği yaşları olduğundan fazla tahmin etme eğilimindedir. Üç kişiyle yapılan testler sırasında uygulama, sürekli olarak bu kişilerin yaşlarının gerçek yaşlarından en az 3 yaş büyük olduğunu tahmin etti.
Son Düşünceler:
Diğer Android uygulamaları görme engelli kullanıcılar için Seeing AI ile benzer özellikler sunarken, Seeing AI rekabete güçlü ve kararlı bir şekilde girdi. Sürekli geliştirmelerle bu uygulama, çeşitli yönlerden güvenilir bir görme engelli asistanına dönüşmek için önemli bir potansiyele sahip. AI görüntü tanıma yeteneklerindeki mevcut liderliği, en azından Google bir gün AI Lookout görüntü tanımlamalarını küresel olarak genişletmeye karar verene kadar veya Be My Eyes, Be My AI özelliğini halka açık hale getirip tanıma için uygulamaya görüntü paylaşma özelliğini ekleyene kadar, onu rakiplerinden ayırıyor.
Seeing AI, neredeyse eksiksiz ve zengin özelliklere sahip bir paket olarak karşımıza çıkarak bizi şaşırttı ve hem kör Android kullanıcılarına hem de rakiplerine sahip olduklarını önemsemeleri ve gelecek adımlarını takip etmeleri için nedenler sundu
.

Yorumlar