Koca Ventures Ltd
71-75 Shelton Street
Covent Garden, London
WC2H 9JQ, United Kingdom
Registered in England & Wales — 16231043
Telefonlarınızı yanıtlayan bir sesli ajan —üstelik kendi donanımınızda çalışan.
İş çağrılarını karşılayan, randevu alan, yönlendiren ve rutin soruları yanıtlayan; sesin her saniyesini kendi ağınızda tutan yerinde sesli ajanlar. Mesele gizlilik ve veri kontrolü — bir bulut platformunun ucuz bir kopyası değil. Sınırlar konusunda da dürüstüz: doğal sıra alışı sağlar, ama insan taklidi yapmaz.
Yerinde sesin gerçekten fark yarattığı yerler
Klinikler ve regülasyona tabi muayenehaneler
Mesai dışı randevu, sigorta ve çalışma saati soruları, önce triyaj sonra aktarma — her çağrı kaydı ve her kelime kendi donanımınızda kalarak. Hasta verisi çok kiracılı bir bulutta duramadığında en temiz çözüm.
Bayiler ve bayi grupları
Servis randevusu alma, çok lokasyonlu çağrı yönlendirme ve tüm hatlar meşgulken müşteri adayı yakalama. Ajan rutin talepleri kendisi karşılar, geri kalanı doğru masaya yönlendirir.
Restoranlar ve konaklama
Rezervasyon, kişi sayısı ve müsaitlik, menü soruları ve teyitler — yoğun saatlerde telefon artık personeli salondan çekmesin.
Mesai dışı ve taşan çağrı resepsiyonu
İşin asıl maliyeti kaçan çağrı: gelen aramaların büyük kısmı mesai dışında veya hat meşgulken geliyor ve arayanların çoğu bir daha dönmüyor. Ajan taşan ve mesai dışı çağrıları üstlenir, randevu alır ya da mesaj iletir, gerçek bir konu varsa onu üst kademeye taşır.
Rutin çağrılar hallolur — zor olanlar devredilir
Randevu alma ve erteleme, çağrı yönlendirme, gün boyu sorulan soruları yanıtlama, geri arama notu alma ve ekibinizin yetişemediği saatleri kapatma. Model tasarım gereği hibrit: ajan çağrıların rutin çoğunluğunu baştan sona kendisi yürütür, gerçek bir konuyu ise toplanmış bağlamla birlikte bir kişiye aktarır. Ekonomik gerekçe basit — mesai dışında veya tüm hatlar meşgulken kaçırdığınız çağrılar çoğunlukla bir daha hiç dönmeyen çağrılar.
Her katman sizin kontrol ettiğiniz donanımda çalışır
Konuşmadan metne (yerel)
İş yükünün omurgası faster-whisper — Türkçe dahil pek çok dilde sağlam, kendi GPU'nuzda çalışır. NVIDIA kartı bulunmayan yerlerde CPU yedeği whisper.cpp devreye girer.
Sıra alışı ve araya girme (yerel)
Konuşma algılama için Silero VAD ve LiveKit'in semantik sıra algılayıcısı; böylece ajan “Onu bir düşünmem lazım…” cümlesinin sıranın sonu olmadığını anlar. CPU'da çalışır ve Türkçeyi gerçekten kapsar — bu da somut bir artı.
Diyalog modeli (yerel)
Eşzamanlı arayanlar için vLLM, tek hatlık basit senaryo içinse Ollama ile sunulan, kendi sunucunuzda barındırılan bir LLM (Qwen3 ya da Llama sınıfı bir 8B) — ajan döngüsünün hızlı kalması için tamamen GPU'nun VRAM'inde tutulur.
Metinden konuşmaya (yerel)
Ticari kullanıma uygun yerel sesler için Kokoro veya Piper; lisansın izin verdiği durumlarda klonlanmış sesler için XTTS-v2. Aşağıdaki dürüst uyarının geçtiği katman tam da burası.
Telefon altyapısı ve SIP köprüsü
Bir SIP trunk (Twilio veya Telnyx) üzerinden gerçek bir telefon numarası, kendi sunucunuzda barındırılan bir medya sunucusuna köprülenir — Asterisk, FreeSWITCH ya da LiveKit SIP. Mevcut santralinizi (PBX) olduğu gibi bırakır, yalnızca seçtiğiniz hatları ajana yönlendiririz.
Orkestrasyon
Pipeline'ı birbirine bağlayan katman LiveKit Agents ya da Pipecat — her aşamayı akış halinde işler, araya girmeleri yönetir ve sahibi olduğunuz donanımda çalışır. Bunu sizin makinelerinizde çalıştırabiliriz ya da yönetilen-yerinde bir seçenek olarak kendi iki düğümlü GPU kümemizde (bir RTX 4090 artı bir RTX 3060) barındırabiliriz.
Yerinde sesin (henüz) yapamadıkları — açıkça söylüyoruz
Yanıt süresi ~0,5–1,2 saniye, insan kadar değil
İyi ayarlanmış yerel bir yığın, baştan sona yarım saniye ile bir saniyenin biraz üzeri arasında bir yanıt süresi yakalar. Bu, doğal ve araya girilebilen bir sıra alışı demek — ama bir insan yaklaşık 200ms boşluk bırakır, en hızlı bulut konuşması bile 0,8–1,1s civarındadır. Bunun bir insandan ayırt edilemez olduğunu söylemeyiz, çünkü değil.
Türkçe metinden konuşma zayıf halka
Ticari kullanıma uygun yerel Türkçe ses (Piper) daha robotik; en doğal olanı (XTTS-v2) ise üretime alınmadan önce ayrı bir anlaşma gerektiren ticari olmayan bir lisansla geliyor. Türkçe konuşmadan metne ve sıra alışı sağlam — ama TTS doğallığında abartmak yerine beklentiyi dürüstçe koyuyoruz.
Yerinde çözüm, bulut çalışma süresini veri kontrolüyle takas eder
Bulut platformları kutudan çıkar çıkmaz %99,9+ coğrafi yedekli çalışma süresi verir. Kendi donanımınızda çalışmak ise tesisinizdeki bir arızanın ele alınması gereken gerçek bir olay olması demektir — bu yüzden yerinde çözüm, bir bakım ve izleme hizmet paketiyle, gerekli olduğu yerde de hibrit yük devretme yoluyla birlikte gelir.
Bazen bulut açıkça daha doğru tercihtir
Belirli bir çağrı hacminin altında, yönetilen bir bulut platformu kurması daha ucuz ve daha hızlıdır ve bunu açıkça söyleriz. Yerinde çözüm; veri egemenliği, regülasyon ya da sürekli yüksek hacim gerçek birer kısıt olduğunda anlam kazanır — herkes için varsayılan bir seçenek olarak değil.
Biz “personelinizin yerini alan bir yapay zeka” ya da insandan ayırt edilemeyen bir ses satmıyoruz — ikisi de doğru değil ve daha ilk çağrıda bunu fark ederdiniz. Bizim kurduğumuz şey, sahibi olduğunuz bir ses sistemi: verinizin durduğu yerde çalışır, rutin yükü üstlenir ve nerede durup işi bir kişiye bıraktığı konusunda dürüsttür.
Azaltma yoluyla gizlilik: ses ağınızdan hiç çıkmadığı için döngüde üçüncü taraf bir işleyici yok ve çağrılarınızın bulutta kaydı tutulmuyor — veri yerleşimi (data-residency) kuralları açısından en temiz yol. Bu, yerinde / çevrimdışı çalışabilen sestir ve diğer yerinde ajan tabanlı sistemlerimizle yan yana durur. Belge zekası yapan ve sesli bir bileşeni bulunmayan yerinde emlak CRM'imizden ayrı bir yetenektir.
Net cevaplar
Bunun Vapi, Retell veya ElevenLabs'tan farkı ne?
Bunlar mükemmel bulut platformları ve hızlı devreye girerler — kutudan çıkan kullanım kolaylığı veya ham ses doğallığında onları geçtiğimizi iddia etmeyeceğiz. Bizim ayrıştığımız nokta farklı: pipeline'ın tamamı sizin donanımınızda çalışır, yani ses, transkriptler ve arayan verisi ağınızdan asla çıkmaz. Sesli sisteme geçmeme nedeniniz 'çağrı kayıtlarımı ABD merkezli, çok kiracılı bir buluta koymam' idiyse, tam olarak o boşlukta çalışıyoruz.
Arayanlar gerçek bir insanla mı konuştuklarını sanır?
Hayır — bunu da iddia etmiyoruz. Bir insan konuşmada yaklaşık 200ms boşluk bırakır; iyi ayarlanmış yerel bir yığın baştan sona 0,5–1,2 saniye civarında yanıt verir. Bu, doğal ve araya girilebilen bir sıra alışıdır, insan taklidi değil. Dürüst çerçeve şu: çağrıların rutin çoğunluğunu temiz biçimde yöneten, zor olanları bir kişiye devreden bir ajan.
Peki ya Türkçe?
Bu konuda açık konuşacağız: Türkçe metinden konuşma şu an zayıf halka. Ticari kullanıma uygun yerel seçenek (Piper) daha robotik, en doğal yerel seçenek (XTTS-v2) ise üretimde kullanmak için ayrı bir anlaşma gerektiren ticari olmayan bir lisansla geliyor. Türkçe konuşmadan metne, Whisper ailesiyle sağlam; sıra alışı modeli de Türkçeyi kapsıyor — ama TTS doğallığında söz vermek yerine beklentiyi dürüstçe ortaya koyuyoruz.
Yerinde çalıştırmanın püf noktası ne?
Yerinde çözüm; bulutun anlık ölçeklenmesini ve coğrafi yedekliliğini, gerçekten sahip olduğunuz veri kontrolüyle takas eder — ve bir bakım yükü ekler. Bir bulut platformu bölgeler genelinde %99,9+ çalışma süresi sunar; tesisinizdeki bir donanım arızası ise birinin elden geçirmesi gereken gerçek bir olaydır. Bunu bir izleme ve bakım hizmet paketiyle, mantıklı olduğu yerde de hibrit yük devretme yoluyla karşılarız. Belirli bir çağrı hacminin altında bulut açıkça daha ucuzdur ve sizin durumunuz buysa size söyleriz.
Fiyatlandırmayı nasıl yapıyorsunuz?
Yerinde çözüm, bulutun dakika başı modelini tersine çevirir. Dakika başına ödemek yerine, bir kerelik kurulum ve entegrasyon ücreti ödersiniz (çağrı akışı tasarımı, mevcut santralinize SIP entegrasyonu, model seçimi ve ayarı, devretme mantığı, devreye alma); ardından hesaplama gücünün sahibi olduğunuz, sayaca bağlı olmadığı için sabit bir aylık ya da hat başı kapasite ücreti — artı bir bakım ve izleme hizmet paketi. PSTN operatörünün dakika başı maliyeti kaçınılmazdır ve aynen yansıtılır. Çağrı akışını anladıktan sonra her iş için ayrı teklif veririz; liste fiyatımız yoktur.
Bu, sizin emlak CRM'inizle aynı şey mi?
Hayır — ayrı şeyler. Yerinde emlak CRM'imiz belge zekası ve erişim (retrieval) yapar; sesli ya da telefon bileşeni yoktur. Sesli ajanlar ayrı bir yetenek: çağrı akışınız etrafında kurulan, sahibi olduğunuz ve verinizin durduğu yerde çalıştırdığınız yeni bir sistem. Sesi CRM'e, CRM'i de buna karıştırmayın.
Last reviewed:
Çağrı akışınızı bize anlatın
Telefonun nerede sıkıntı yarattığını anlatın — mesai dışında kaçan randevular, meşgul hatlardaki taşan çağrılar, ekibinizin gününü yiyen rutin sorular — biz de gerçek çağrı akışınız etrafında yerinde bir sesli ajan tasarlayalım. Fiyatlandırma iş bazlıdır, kapsamı anladıktan sonra teklif edilir.
