İnanç ÇakıroğluKöşe Yazıları

Turkcell’de Ses İşleme Çalışmaları

0
Turkcell’de Ses İşleme Çalışmaları

Son yıllarda yapay zekanın hayatımıza girmesi ile birlikte ses işleme teknolojisini kullanarak yapılan çözümler de günlük hayatımıza yaygın şekilde dahil olmaya başlamıştır. Arama motorlarında sesli aramalar yapılabilmesi, çağrı merkezlerinin bizi sesimizden tanıyıp ihtiyacımızı anlayabilmesi, sanal asistanlarla doğal şekilde konuşarak ihtiyaçlarımızı karşılayabilmemiz, aracımızdaki ekipmanları sesli olarak kontrol edebilmemiz bu çağın kaçınılmaz alışkanlıkları olarak karşımıza çıkıyor. Önümüzdeki dönemde 5G’nin de hayatımıza girmesi ile evlerimizdeki IOT tabanlı cihazlar ile de bu teknoloji sayesinde sesli iletişim kurabileceğiz.

Peki bu konu üzerinde yapılan çalışmalar ne zaman başladı? İnsanların makinelerden ses çıkarabilme ve makineler ile sesli iletişim kurabilme motivasyonu ile yaptıkları çalışmalar 1700’lü yıllara dayanıyor. İlk olarak 1784 yılında Wolfgang Von Kempelen Viyana’da akustik-mekanik bir ses üretme makinesi icat etmiştir. Bu makine mekanik yollarla insan sesine yakın ses çıkarabilen ilk makinedir. Bu icat ses sentezi ve analizi ile ilgili sonrasında yapılan tüm icatlara ışık tutma niteliği taşımaktadır. Bu alandaki en önemli gelişmeler Google’ın 2008 yılında sesli arama yetkinliğini lanse etmesi ve Apple’ın 2011 yılında SIRI’yi piyasaya sürmesi ile yaşanmıştır. Sonrasında tüm teknoloji devleri lanse ettikleri sesli mobil ve ev asistanları ile bu alandaki çalışmalara ivme kazandırarak müşteri davranışı ve beklentisinin evrilmesinde güçlü rol oynamışlardır. Ses analitiği çalışmaları insan-makine iletişimini insan-insan iletişimine yakınsayacak olgunluğa getirme misyonu ile halen aktif bir şekilde devam etmektedir.

Ses işlemeyi 2 ana başlık altında toplayabiliriz;

Bunlardan birincisi ses analizi olup, sesten metine dönüştürme (Speech To Text) bu başlığın altında yer alır. Ayrıca ses analizi teknikleri ile ses tanıma (Speech Recognition) ve ses içerisinde geçen metinlerdeki belirli kelimelerin aratılabilmesi, sesteki duygunun anlaşılabilmesi, konuşulan sesin hangi dile ait olduğunun anlaşılabilmesi gibi yetkinlikler de sağlanabilmektedir.

Sesten metine çevirme çalışmalarındaki en zorlayıcı kısım farklı bölgelerde farklı şiveler ve ağızlar ile konuşan insanların konuştuklarını metine çevirebilme kısmıdır. Aynı kelime farklı insanlar tarafından çok farklı telaffuz ve tonlama ile seslendirilebilmektedir. Tüm farklılıkları tanıyıp kelimeyi düzgün bir şekilde metine dökebilmek için modelin de bu farklılıkları içeren datalar ile eğitilmiş olması gerekmektedir. Modelleri ne kadar farklı bölge, yaş, cinsiyet ve konuşma tarzındaki insanların ses datası ile eğitirsek modellerin bu farklılıkları anlama başarısı da o kadar yüksek olacaktır.

Ses işleme konusundaki diğer başlık ise ses sentezidir. Bu teknik sayesinde, insan sesini sentezleyerek verdiğimiz her türlü içeriği okuyabilen bir yapay zeka sesi üretmiş oluyoruz. Bu çalışmadaki en büyük zorluk ise ürettiğimiz yapay zeka sesini insan sesine yakın vurgu ve tonlama ile konuşabilecek hale getirebilmektir. Bunu yapabilmek için, ilgili yapay zeka sesine baz olacak insan sesinin, tüm ses geçişlerini kapsayacak içeriklerin akıllı bir şekilde oluşturulduğu metini, profesyonel stüdyo ortamında okuması ile elde edilmiş büyük hacimli bir eğitim datasına ihtiyaç duyulmaktadır. İhtiyaç duyulan ses kayıt datası 20 saat ile 100 saat arasında değişebilmektedir. Ses sanatçısının vurgu ve tonlaması, okuduğu metnin içeriği, toplam ses kaydı süresi, kullanılan algoritmalar ve iterasyon sayısı modelin başarısını etkileyen faktörler arasındadır.

Turkcell’de ses analitiği çalışmaları birçok farklı alanda kullanılıyor. Örneğin Turkcell Beni Sesimden Tanır Servisi, sesimizi ses işleme algoritmaları yardımıyla tanıyor. Teknolojisi Zirvesinde demo sunumunu yaptığımız Yaani Asistan ürünü temelinde yukarıda bahsettiğimiz ses modellerini, doğal dil işleme ve anlama yöntemleri ile birleştirerek kullanmaktadır. Turkcell, yakın zamanda bu ürünü mobil uygulama olarak müşterileri ile buluşturacak. Bu ürün ile birlikte kazanılacak yetkinlikler sayesinde, dijital ürünlerimiz ile insan etkileşimi konuşarak yapılabiliyor olacak.

Aşağıdaki QR kodunu taratarak size özel hazırladığımız mesajımızı Turkcell’in yapay zeka sesinden dinleyebilirsiniz.

Comments

Comments are closed.

Login/Sign up