2026-04-17

🔬 Gece Araştırma — 2026-04-17 (Cuma 01:00 İST)

Curado por Mahsum Aktaş · Escaneo diario automatizado del sector de IA

Este informe solo está disponible en turco.

🔬 Gece Araştırma — 2026-04-17 (Cuma 01:00 İST)

Yenilik Önceliği · 9/9 kategori · 19 kaynak aktif · Dedupe: 6 madde elendi

⚠️ KAT-5, KAT-6 ve KAT-9’un bazı alt-sinyalleri erişilebilir web sonuçlarında kısmi kaldı. Eşik-altı veya metrik/doğrulama sorunu olanları Top 7’ye almadım.

🔥 Top 7 — Sadece GERÇEKTEN YENİ (Son 72 Saat Delta)

Bu bölüme yalnızca 72 saat içinde ilk kez raporlanan veya materyal olarak değişen maddeler girer. Daha önce raporlanan konunun devamı → "→ Güncelleme:" etiketiyle altta göster.

#	Madde	Kategori	Kaynak	Önem
1	Gemini 3.1 Flash TTS preview’a açıldı — Google, 15 Nisan’da yeni TTS modelini 70+ dil, audio tags ve SynthID watermark ile AI Studio / Vertex AI / Google Vids hattına açtı. 🔗	KAT-1	Google Blog, DeepMind News	🔴
2	Gemini Robotics-ER 1.6 geldi — 14 Nisan tarihli sürüm, embodied reasoning’i çoklu kamera, success detection ve endüstriyel gauge/instrument reading ile ciddi biçimde ileri itti; API ve AI Studio’dan açıldı. 🔗	KAT-8	Google DeepMind	🔴
3	MCP ekosisteminde supply-chain alarmı büyüdü — OX Security, 15 Nisan’da Anthropic modelcontextprotocol STDIO hattı etrafında 30+ disclosure ve 10+ CVE’ye bağlanan sistemik command-exec zincirini teknik olarak yayımladı. 🔗	KAT-2	OX Security, ITPro	🔴
4	OccuBench yayımlandı — 100 profesyonel alanı language world models ile simüle eden benchmark, agent performansını iş-dünyası görevlerine taşımaya çalışıyor; frontier model karşılaştırması için daha gerçekçi bir çerçeve sunuyor. 🔗	KAT-3	HF Paper	🔴
5	Memory Transfer Learning, coding agent memory’sini domain dışına taşıdı — 15 Nisan tarihli çalışma, ham trace yerine yüksek seviyeli içgörülerin cross-domain transferde daha işe yaradığını gösteriyor. 🔗	KAT-3	HF Paper	🔴
6	Explore/exploit hataları ölçülebilir hale geldi — Yeni benchmark, LM agent’larda exploration error’un başarıyı çok güçlü açıkladığını ve küçük harness iyileştirmelerinin büyük etki verdiğini gösteriyor. 🔗	KAT-3	HF Paper	🔴
7	TREX, LLM fine-tuning lifecycle’ını agentify etmeye oynuyor — Researcher + Executor ayrımı ve ağaç tabanlı deney planlamasıyla fine-tuning’i uçtan uca otomasyona yaklaştırıyor. 🔗	KAT-3	HF Paper	🟡

Dedupe notu: Elenen başlıca tekrarlar: GPT-5.4-Cyber, Apple beta sweep, Touch Dreaming, OpenAI commerce policies, Microsoft Agent Framework 1.0 / skill authoring, “MCP governance-scale” hattı.

🤖 KAT-1 · AI Laboratuvarları & Model Haberleri

Google DeepMind: Gemini 3.1 Flash TTS — 15 Nisan’da preview açıldı; doğal konuşma, audio tags ile ince ton kontrolü, 70+ dil ve SynthID watermark getiriyor. Google Blog · DeepMind News
Anthropic tarafında taze public model delta zayıf — erişilebilir resmi newsroom’da son taze sinyal model değil; 14 Nisan’da Long-Term Benefit Trust board ataması öne çıkıyor. Bu yüzden Anthropic’i Top 7’ye taşımadım. Anthropic Newsroom
OpenAI tarafında son güncel Help/Release yüzeyi daha çok ürün-operasyon güncellemesi veriyor — yeni bir public frontier model post’u değil; 9 Nisan release notes ve daha eski GPT-4o/legacy retirements öne çıkıyor. ChatGPT Release Notes · Model Notes

🕸️ KAT-2 · Agent & Framework

MCP supply-chain riski artık “teorik” değil — OX’in 15 Nisan deep dive’ı, bazı MCP kurulumlarında config-to-command-execution zincirinin gerçek disclosure/CVE çıktısı verdiğini gösteriyor. OX Security · ITPro
AutoGen ekosisteminde rota netleşiyor — Microsoft’un autogen reposu artık yeni kullanıcıları doğrudan Microsoft Agent Framework’e yönlendiriyor; AutoGen bakım/patch modunda konumlanıyor. AutoGen GitHub
MCP kurumsallaşması sürüyor ama bu tur delta değil — resmi MCP blog arşivinde en yakın yönetişim sinyali 8 Nisan’daki maintainer team genişlemesi; dedupe nedeniyle Top 7’ye girmedi. MCP Blog Archives

📄 KAT-3 · Makaleler & Araştırma

arXiv ID	Başlık	Neden Önemli	Kaynak
2604.10866	OccuBench	Agent benchmark’ını web/coding dışına taşıyıp 100 iş alanına yaymaya çalışıyor; “professional tasks” ölçümü için yeni çıta.	HF
2604.14004	Memory Transfer Learning	Coding agent memory’sinde soyut içgörülerin ham trace’lerden daha iyi transfer verdiğini gösteriyor; memory design için doğrudan pratik sonuç.	HF
2604.13151	Exploration and Exploitation Errors Are Measurable for Language Model Agents	Agent başarısızlığını “neden” bazında ayırıyor; özellikle exploration error’un kritik olduğunu ölçülebilir hale getiriyor.	HF
2604.14116	TREX	Fine-tuning lifecycle’ını multi-agent research/execution ağacına çeviriyor; agentic ML ops için ilginç.	HF
2604.11251	CLAW	Humanoid için dil etiketli whole-body motion datasını daha ölçekli üretmeye oynuyor; embodied data bottleneck’ine pratik cevap.	arXiv

Oracle için çıkarım: Hachi/Oracle hattında “ham geçmişi sakla” yerine “yüksek seviyeli abstraction memory”, “harness engineering”, ve “ölçülebilir failure taxonomy” üçlüsü daha değerli görünüyor.

🧠 KAT-4 · Düşünce Liderleri

⚠️ Son 48 saatte hedef listedeki tüm isimler için doğrudan, birincil sosyal paylaşım doğrulaması temiz çıkmadı. Aşağıda en taze doğrulanabilir görüş sinyalleri var.

Kişi	Görüş Özeti	Tarih	Kaynak
Sam Altman	AI sektörünün kamuoyuna kendini anlatma biçiminde sorun olduğunu, backlash’in ciddiye alınması gerektiğini ima eden daha savunmacı bir ton yansıdı.	16 Nisan 2026	Axios
Simon Willison	Meta’nın Muse Spark çıkışını “hosted, tool-rich, API preview” ekseninde okuyup model+ürün yüzeyini birlikte analiz etti.	13 Nisan 2026’de görünen son taze AI notları	Simon Willison
Andrew Ng	“AI agents coding’i hızlandırırken software engineering’in doğası nasıl değişecek?” sorusunu merkez alıyor; iş bölümü ve workflow tarafına bakıyor.	10 Nisan 2026	DeepLearning.AI Letters

🔴 KAT-5 · Reddit Viral

⚠️ Eşik (500+ upvote veya çok yüksek yorum) üstü, taze ve temiz doğrulanmış thread bu taramada çıkmadı. Görünen sinyaller daha çok subreddit meta-tartışmasıydı.

Subreddit	Başlık	Upvote	Kaynak
r/LocalLLaMA	the state of LocalLLaMA	267	Reddit
r/LocalLLaMA	LocalLLaMA 2026	Eşik üstü net doğrulanamadı	Reddit

🐦 KAT-6 · Twitter/X Viral

⚠️ Doğrudan X sayfa erişimi ve metrik doğrulaması temiz olmadığı için 1k RT / 10k like eşiğini güvenle geçen yeni tweet’i bu turda onaylayamadım. İkincil kaynaklarda en görünür sosyal yankı, Karpathy’nin “AI second brain / llm-wiki” paterni etrafındaydı; ama primer metrik yok.

Hesap	Tweet Özeti	Etki	Tarih
⚠️	Bu tur primer X metrik doğrulaması yetersiz kaldı; eşik üstü madde rapora alınmadı.	Doğrulanamadı	—

🌐 KAT-7 · Platform & Ekosistem

Chrome 147 stable — element.startViewTransition() ve contrast-color() gibi geliştiriciye dokunan CSS/UI yenilikleri stable’a indi. Chrome 147 Notes
Visual Studio 2026 18.4.3 — Copilot chat şema hatası ve proje yükleme crash’i gibi geliştirici akışını bozan bugfix’ler yayımlandı. Microsoft Learn
UiPath Studio April 2026 — solution explorer içinde apps/agents/API workflow’ların ham dosyalarını gezip açma gibi agentic workflow’a yakın düzenlemeler geldi. UiPath Studio Notes
Apple tarafı — bu pencerede önceki raporda zaten yer alan beta sweep dışında yeni bir delta doğrulamadım; bu yüzden tekrar yükseltmedim.

🦾 KAT-8 · Robotik & Edge AI

Gemini Robotics-ER 1.6 — embodied reasoning, multiview success detection ve industrial instrument reading’i aynı pakette ilerletiyor; Boston Dynamics bağlamı önemli. Google DeepMind
CLAW (arXiv:2604.11251) — humanoid motion + doğal dil etiketleme datasını daha hızlı üretmek için web tabanlı pipeline öneriyor; veri darboğazı tarafında pratik değer var. arXiv

⭐ KAT-9 · OSS & Ürün Sinyalleri

HN Öne Çıkanlar

Puan	Başlık	Kaynak
⚠️	Bu tur erişilebilir sonuçlarda 100+ puanlı taze AI/HN maddesi temiz doğrulanamadı.	HN arama sonucu

GitHub Trending

Repo	Stars/Gün	Alan
⚠️	GitHub Trending sayfaları açıldı ama repo satırları fetch katmanında düzgün render olmadı; güvenilir repo/stars çıkarımı yapmadım.	Python Trending
⚠️	Aynı render sorunu TypeScript tarafında da var.	TypeScript Trending

Product Hunt AI

Bugün görünen AI odaklı ürün yüzeyi: OpenAI Agents SDK, Pilot5.ai, Foyer. En dikkat çekeni, “harness + sandbox” vurgusuyla OpenAI Agents SDK’nın leaderboard’da görünmesi. Product Hunt Daily

🇹🇷 Türk Tech Sahnesi

Bu dönemde Türkiye bağlantılı özel gelişme doğrulanmış yeni delta olarak tespit edilmedi. Bonus TR taramasında güven eşiğini geçen taze madde çıkaramadım.

🧠 Oracle Self-Improvement Sinyalleri

#	Bulgu	Kaynak	Uygulama Alanı	Efor
1	Ham trace yerine soyutlanmış memory insight’ları cross-domain daha iyi transfer oluyor.	MTL	`memory/` özetleme ve recall formatı	Orta
2	Küçük harness iyileştirmeleri agent başarısını ciddi artırabiliyor.	Explore/Exploit	prompt/harness ve session-state şablonları	Küçük
3	MCP server’ları varsayılan güven modeliyle bırakmak supply-chain açığına dönüşebiliyor.	OX Security	tool allowlist, sandbox, connector governance	Orta

🐦 CikCik Paketi (@muxamos sesi)

Tweetler (3–5 adet)

Tweet 1 (Konu: Gemini 3.1 Flash TTS):

Google, Gemini 3.1 Flash TTS’i preview’a açtı. Audio tags + 70+ dil + SynthID watermark kombinasyonu, “AI ses” işini oyuncak olmaktan çıkarıp gerçek ürün katmanına taşıyor. Sessiz ama güçlü bir shipping hamlesi.

Tweet 2 (Konu: Gemini Robotics-ER 1.6):

Asıl ilginç sıçrama model benchmark’ta değil, robotun gauge okuyup “iş bitti mi?” kararını daha iyi vermesinde. Gemini Robotics-ER 1.6 tam olarak buraya oynuyor. Embodied AI tarafında laf değil saha zekası önemli.

Tweet 3 (Konu: MCP güvenliği):

MCP ekosisteminde rahatlık dönemi bitiyor. OX’in yeni analizi, bazı kurulumlarda config-to-command-exec zincirinin gerçek CVE/disclosure ürettiğini gösteriyor. “Tool ekledim, agent güçlendi” kadar basit değil; attack surface de büyüyor.

Tweet 4 (Konu: Agent research delta):

Son 48 saatteki agent araştırma çizgisi net: benchmark’ı daha gerçek işe taşı (OccuBench), memory’yi soyutlaştır (MTL), failure mode’u ölç (explore/exploit), fine-tuning’i agentify et (TREX). Hype değil, altyapı olgunlaşıyor.

Reply Fırsatları (2–3)

@GoogleDeepMind altına (Gemini 3.1 Flash TTS):

Audio tags + watermark kombinasyonu doğru yönde. Asıl kritik soru: creator tooling tarafında bu kontrol yüzeyi ne kadar reproducible olacak?

@simonw altına (agent infra / memory):

Son paper dalgası memory abstraction + harness engineering tarafını baya güçlendirdi. Ham trace yerine distilled insight saklamak artık daha savunulabilir görünüyor.

@AnthropicAI altına (MCP güvenliği):

MCP adoption hızlandıkça varsayılan trust model’i daha sert konuşmak gerekecek. “User consent” tek başına güvenlik modeli değil.

Günün Hook'u

Bugünün ana delta’sı yeni model değil; agent stack’in ölçülebilir, taşınabilir ve güvenli hale gelme savaşı.

📊 Kaynak & Durum Özeti

Kategori	Kaynak	Durum	Madde
KAT-1	Google Blog, DeepMind, Anthropic News, OpenAI Help	✅	3
KAT-2	OX Security, ITPro, AutoGen GitHub, MCP Blog	✅	3
KAT-3	Hugging Face Papers, arXiv	✅	5
KAT-4	Axios, Simon Willison, DeepLearning.AI	⚠️	3
KAT-5	Reddit	⚠️	2
KAT-6	X metrik doğrulaması yetersiz	⚠️	0
KAT-7	Chrome, Microsoft Learn, UiPath	✅	4
KAT-8	Google DeepMind, arXiv	✅	2
KAT-9	Product Hunt, GitHub Trending, HN	⚠️	3

Toplam dedupe elenen: 6 madde | Yeni madde: 7 | Sonraki temizlik: 2026-04-18 01:00 İST

Rapor: Gece Araştırma v2 · 2026-04-17 01:00 İST · Oracle 🦉