Gönderi

Ses Klonlanma Teknolojileri Yayılıyor
OpenAl, sadece 15 saniyelik bir ses kaydından herhangi bir kişinin sesini klonlayarak istenilen metni onun ses tonunda ve tarzında söyleyebilen bir teknoloji geliştirdiğini duyurdu. "Voice Engine" adı verilen bu araç, ilk olarak 2022'de geliştirilmiş ancak yanıltıcı amaçlarla kullanılma riski nedeniyle genel kullanıma açılmamıştı. Öte yandan Open Al'in bu hizmeti sunup sunmaması o kadar da önemli olmayabilir çünkü bu alanda halihazırda başarılı ürünler üreten birçok firma var, örneğin ElevenLabs bu alandaki öncü firmalardan birisi. Yakın zamanda yayınlanan Voice Craft adındaki açık kaynak ses klonlama kütüphanesiyle ücretsiz bir şekilde ses klonlamak mümkün ve sonuçlar şaşırtıcı derecede başarılı. Spotify podcast konuşmacısının sesini kullanarak başka dillerde otomatik çevirisini yapan bir teknoloji kullanmaya başladı. Apple IOS 17 güncellemesi ile telefonunuzun sizin sesinizle konuşmasını sağlayan bir özellik yayınlandı. Yakın zamanda ALS (amyotrofik lateral skleroz) teşhisi konmuş kişiler veya konuşma yeteneğini aşamalı olarak etkileyebilecek diğer rahatsızlıklar gibi konuşma yeteneklerini kaybetme riski taşıyan kullanıcılar için tasarlanan sistem bu durumdaki kişilerin kendilerine benzeyen bir ses oluşturmasını sağlıyor. Öte yandan iPhone'daki süreç biraz uzun ve meşakkatli. Kullanıcı tarafından birçok cümlenin okunması ve sonrasında telefonun uzunca bir süre hesaplama işlemi yapmasının beklenmesi gerekiyor. Diğer taraftan yapay zekâ sadece ses klonlamasında değil şarkı üretiminde de hayli başarılı sonuçlar vermeye başladı. Udio ve Suno gibi uygulamalar yazdığınız şarkı sözlerini klasik müzikten metal müziğe varan geniş bir yelpazede şarkılara dönüştürüyor. Udio ayda 1.200 şarkıyı, Suno ise günde 10 şarkıyı ücretsiz oluşturma hakkı veriyor. Suno tarafından benzer işleri yapan Bark adında açık kaynak kütüphanesi de ücretsiz olarak sunuluyor. Geçtiğimiz aylarda yayınlanan açık kaynak Stable Auido 2 ise 3 dakikaya varan enstrümantal müzikler üretebiliyor. Bu projeler çok etkileyici olsa da ortaya çıkan üründe ufak tefek düzenlemeler yaparak olgunlaştırmayı sağlayan özelliklerden yoksunlar. Bu nedenle sonuçları ya beğeniyorsunuz ya da saçma buluyorsunuz. Muhtemelen önümüzdeki yıllarda bu tür sentetik şarkıları düzenleyebilen yapay zekâları göreceğiz.
Sayfa 32 - Tübitak Yayınları
·
21 görüntüleme
Yorum yapabilmeniz için giriş yapmanız gerekmektedir.