🔬 Gece Araştırma — 2026-04-17 (Cuma 01:00 İST)
Curado por Mahsum Aktaş · Escaneo diario automatizado del sector de IA
🔬 Gece Araştırma — 2026-04-17 (Cuma 01:00 İST)
Yenilik Önceliği · 9/9 kategori · 19 kaynak aktif · Dedupe: 6 madde elendi
⚠️ KAT-5, KAT-6 ve KAT-9’un bazı alt-sinyalleri erişilebilir web sonuçlarında kısmi kaldı. Eşik-altı veya metrik/doğrulama sorunu olanları Top 7’ye almadım.
🔥 Top 7 — Sadece GERÇEKTEN YENİ (Son 72 Saat Delta)
Bu bölüme yalnızca 72 saat içinde ilk kez raporlanan veya materyal olarak değişen maddeler girer. Daha önce raporlanan konunun devamı → "→ Güncelleme:" etiketiyle altta göster.
| # | Madde | Kategori | Kaynak | Önem |
|---|---|---|---|---|
| 1 | Gemini 3.1 Flash TTS preview’a açıldı — Google, 15 Nisan’da yeni TTS modelini 70+ dil, audio tags ve SynthID watermark ile AI Studio / Vertex AI / Google Vids hattına açtı. 🔗 | KAT-1 | Google Blog, DeepMind News | 🔴 |
| 2 | Gemini Robotics-ER 1.6 geldi — 14 Nisan tarihli sürüm, embodied reasoning’i çoklu kamera, success detection ve endüstriyel gauge/instrument reading ile ciddi biçimde ileri itti; API ve AI Studio’dan açıldı. 🔗 | KAT-8 | Google DeepMind | 🔴 |
| 3 | MCP ekosisteminde supply-chain alarmı büyüdü — OX Security, 15 Nisan’da Anthropic modelcontextprotocol STDIO hattı etrafında 30+ disclosure ve 10+ CVE’ye bağlanan sistemik command-exec zincirini teknik olarak yayımladı. 🔗 | KAT-2 | OX Security, ITPro | 🔴 |
| 4 | OccuBench yayımlandı — 100 profesyonel alanı language world models ile simüle eden benchmark, agent performansını iş-dünyası görevlerine taşımaya çalışıyor; frontier model karşılaştırması için daha gerçekçi bir çerçeve sunuyor. 🔗 | KAT-3 | HF Paper | 🔴 |
| 5 | Memory Transfer Learning, coding agent memory’sini domain dışına taşıdı — 15 Nisan tarihli çalışma, ham trace yerine yüksek seviyeli içgörülerin cross-domain transferde daha işe yaradığını gösteriyor. 🔗 | KAT-3 | HF Paper | 🔴 |
| 6 | Explore/exploit hataları ölçülebilir hale geldi — Yeni benchmark, LM agent’larda exploration error’un başarıyı çok güçlü açıkladığını ve küçük harness iyileştirmelerinin büyük etki verdiğini gösteriyor. 🔗 | KAT-3 | HF Paper | 🔴 |
| 7 | TREX, LLM fine-tuning lifecycle’ını agentify etmeye oynuyor — Researcher + Executor ayrımı ve ağaç tabanlı deney planlamasıyla fine-tuning’i uçtan uca otomasyona yaklaştırıyor. 🔗 | KAT-3 | HF Paper | 🟡 |
Dedupe notu: Elenen başlıca tekrarlar: GPT-5.4-Cyber, Apple beta sweep, Touch Dreaming, OpenAI commerce policies, Microsoft Agent Framework 1.0 / skill authoring, “MCP governance-scale” hattı.
🤖 KAT-1 · AI Laboratuvarları & Model Haberleri
- Google DeepMind: Gemini 3.1 Flash TTS — 15 Nisan’da preview açıldı; doğal konuşma, audio tags ile ince ton kontrolü, 70+ dil ve SynthID watermark getiriyor. Google Blog · DeepMind News
- Anthropic tarafında taze public model delta zayıf — erişilebilir resmi newsroom’da son taze sinyal model değil; 14 Nisan’da Long-Term Benefit Trust board ataması öne çıkıyor. Bu yüzden Anthropic’i Top 7’ye taşımadım. Anthropic Newsroom
- OpenAI tarafında son güncel Help/Release yüzeyi daha çok ürün-operasyon güncellemesi veriyor — yeni bir public frontier model post’u değil; 9 Nisan release notes ve daha eski GPT-4o/legacy retirements öne çıkıyor. ChatGPT Release Notes · Model Notes
🕸️ KAT-2 · Agent & Framework
- MCP supply-chain riski artık “teorik” değil — OX’in 15 Nisan deep dive’ı, bazı MCP kurulumlarında config-to-command-execution zincirinin gerçek disclosure/CVE çıktısı verdiğini gösteriyor. OX Security · ITPro
- AutoGen ekosisteminde rota netleşiyor — Microsoft’un
autogenreposu artık yeni kullanıcıları doğrudan Microsoft Agent Framework’e yönlendiriyor; AutoGen bakım/patch modunda konumlanıyor. AutoGen GitHub - MCP kurumsallaşması sürüyor ama bu tur delta değil — resmi MCP blog arşivinde en yakın yönetişim sinyali 8 Nisan’daki maintainer team genişlemesi; dedupe nedeniyle Top 7’ye girmedi. MCP Blog Archives
📄 KAT-3 · Makaleler & Araştırma
| arXiv ID | Başlık | Neden Önemli | Kaynak |
|---|---|---|---|
| 2604.10866 | OccuBench | Agent benchmark’ını web/coding dışına taşıyıp 100 iş alanına yaymaya çalışıyor; “professional tasks” ölçümü için yeni çıta. | HF |
| 2604.14004 | Memory Transfer Learning | Coding agent memory’sinde soyut içgörülerin ham trace’lerden daha iyi transfer verdiğini gösteriyor; memory design için doğrudan pratik sonuç. | HF |
| 2604.13151 | Exploration and Exploitation Errors Are Measurable for Language Model Agents | Agent başarısızlığını “neden” bazında ayırıyor; özellikle exploration error’un kritik olduğunu ölçülebilir hale getiriyor. | HF |
| 2604.14116 | TREX | Fine-tuning lifecycle’ını multi-agent research/execution ağacına çeviriyor; agentic ML ops için ilginç. | HF |
| 2604.11251 | CLAW | Humanoid için dil etiketli whole-body motion datasını daha ölçekli üretmeye oynuyor; embodied data bottleneck’ine pratik cevap. | arXiv |
Oracle için çıkarım: Hachi/Oracle hattında “ham geçmişi sakla” yerine “yüksek seviyeli abstraction memory”, “harness engineering”, ve “ölçülebilir failure taxonomy” üçlüsü daha değerli görünüyor.
🧠 KAT-4 · Düşünce Liderleri
⚠️ Son 48 saatte hedef listedeki tüm isimler için doğrudan, birincil sosyal paylaşım doğrulaması temiz çıkmadı. Aşağıda en taze doğrulanabilir görüş sinyalleri var.
| Kişi | Görüş Özeti | Tarih | Kaynak |
|---|---|---|---|
| Sam Altman | AI sektörünün kamuoyuna kendini anlatma biçiminde sorun olduğunu, backlash’in ciddiye alınması gerektiğini ima eden daha savunmacı bir ton yansıdı. | 16 Nisan 2026 | Axios |
| Simon Willison | Meta’nın Muse Spark çıkışını “hosted, tool-rich, API preview” ekseninde okuyup model+ürün yüzeyini birlikte analiz etti. | 13 Nisan 2026’de görünen son taze AI notları | Simon Willison |
| Andrew Ng | “AI agents coding’i hızlandırırken software engineering’in doğası nasıl değişecek?” sorusunu merkez alıyor; iş bölümü ve workflow tarafına bakıyor. | 10 Nisan 2026 | DeepLearning.AI Letters |
🔴 KAT-5 · Reddit Viral
⚠️ Eşik (500+ upvote veya çok yüksek yorum) üstü, taze ve temiz doğrulanmış thread bu taramada çıkmadı. Görünen sinyaller daha çok subreddit meta-tartışmasıydı.
| Subreddit | Başlık | Upvote | Kaynak |
|---|---|---|---|
| r/LocalLLaMA | the state of LocalLLaMA | 267 | |
| r/LocalLLaMA | LocalLLaMA 2026 | Eşik üstü net doğrulanamadı |
🐦 KAT-6 · Twitter/X Viral
⚠️ Doğrudan X sayfa erişimi ve metrik doğrulaması temiz olmadığı için 1k RT / 10k like eşiğini güvenle geçen yeni tweet’i bu turda onaylayamadım. İkincil kaynaklarda en görünür sosyal yankı, Karpathy’nin “AI second brain / llm-wiki” paterni etrafındaydı; ama primer metrik yok.
| Hesap | Tweet Özeti | Etki | Tarih |
|---|---|---|---|
| ⚠️ | Bu tur primer X metrik doğrulaması yetersiz kaldı; eşik üstü madde rapora alınmadı. | Doğrulanamadı | — |
🌐 KAT-7 · Platform & Ekosistem
- Chrome 147 stable —
element.startViewTransition()vecontrast-color()gibi geliştiriciye dokunan CSS/UI yenilikleri stable’a indi. Chrome 147 Notes - Visual Studio 2026 18.4.3 — Copilot chat şema hatası ve proje yükleme crash’i gibi geliştirici akışını bozan bugfix’ler yayımlandı. Microsoft Learn
- UiPath Studio April 2026 — solution explorer içinde apps/agents/API workflow’ların ham dosyalarını gezip açma gibi agentic workflow’a yakın düzenlemeler geldi. UiPath Studio Notes
- Apple tarafı — bu pencerede önceki raporda zaten yer alan beta sweep dışında yeni bir delta doğrulamadım; bu yüzden tekrar yükseltmedim.
🦾 KAT-8 · Robotik & Edge AI
- Gemini Robotics-ER 1.6 — embodied reasoning, multiview success detection ve industrial instrument reading’i aynı pakette ilerletiyor; Boston Dynamics bağlamı önemli. Google DeepMind
- CLAW (arXiv:2604.11251) — humanoid motion + doğal dil etiketleme datasını daha hızlı üretmek için web tabanlı pipeline öneriyor; veri darboğazı tarafında pratik değer var. arXiv
⭐ KAT-9 · OSS & Ürün Sinyalleri
HN Öne Çıkanlar
| Puan | Başlık | Kaynak |
|---|---|---|
| ⚠️ | Bu tur erişilebilir sonuçlarda 100+ puanlı taze AI/HN maddesi temiz doğrulanamadı. | HN arama sonucu |
GitHub Trending
| Repo | Stars/Gün | Alan |
|---|---|---|
| ⚠️ | GitHub Trending sayfaları açıldı ama repo satırları fetch katmanında düzgün render olmadı; güvenilir repo/stars çıkarımı yapmadım. | Python Trending |
| ⚠️ | Aynı render sorunu TypeScript tarafında da var. | TypeScript Trending |
Product Hunt AI
Bugün görünen AI odaklı ürün yüzeyi: OpenAI Agents SDK, Pilot5.ai, Foyer. En dikkat çekeni, “harness + sandbox” vurgusuyla OpenAI Agents SDK’nın leaderboard’da görünmesi. Product Hunt Daily
🇹🇷 Türk Tech Sahnesi
Bu dönemde Türkiye bağlantılı özel gelişme doğrulanmış yeni delta olarak tespit edilmedi. Bonus TR taramasında güven eşiğini geçen taze madde çıkaramadım.
🧠 Oracle Self-Improvement Sinyalleri
| # | Bulgu | Kaynak | Uygulama Alanı | Efor |
|---|---|---|---|---|
| 1 | Ham trace yerine soyutlanmış memory insight’ları cross-domain daha iyi transfer oluyor. | MTL | memory/ özetleme ve recall formatı | Orta |
| 2 | Küçük harness iyileştirmeleri agent başarısını ciddi artırabiliyor. | Explore/Exploit | prompt/harness ve session-state şablonları | Küçük |
| 3 | MCP server’ları varsayılan güven modeliyle bırakmak supply-chain açığına dönüşebiliyor. | OX Security | tool allowlist, sandbox, connector governance | Orta |
🐦 CikCik Paketi (@muxamos sesi)
Tweetler (3–5 adet)
Tweet 1 (Konu: Gemini 3.1 Flash TTS):
Google, Gemini 3.1 Flash TTS’i preview’a açtı. Audio tags + 70+ dil + SynthID watermark kombinasyonu, “AI ses” işini oyuncak olmaktan çıkarıp gerçek ürün katmanına taşıyor. Sessiz ama güçlü bir shipping hamlesi.
Tweet 2 (Konu: Gemini Robotics-ER 1.6):
Asıl ilginç sıçrama model benchmark’ta değil, robotun gauge okuyup “iş bitti mi?” kararını daha iyi vermesinde. Gemini Robotics-ER 1.6 tam olarak buraya oynuyor. Embodied AI tarafında laf değil saha zekası önemli.
Tweet 3 (Konu: MCP güvenliği):
MCP ekosisteminde rahatlık dönemi bitiyor. OX’in yeni analizi, bazı kurulumlarda config-to-command-exec zincirinin gerçek CVE/disclosure ürettiğini gösteriyor. “Tool ekledim, agent güçlendi” kadar basit değil; attack surface de büyüyor.
Tweet 4 (Konu: Agent research delta):
Son 48 saatteki agent araştırma çizgisi net: benchmark’ı daha gerçek işe taşı (OccuBench), memory’yi soyutlaştır (MTL), failure mode’u ölç (explore/exploit), fine-tuning’i agentify et (TREX). Hype değil, altyapı olgunlaşıyor.
Reply Fırsatları (2–3)
@GoogleDeepMind altına (Gemini 3.1 Flash TTS):
Audio tags + watermark kombinasyonu doğru yönde. Asıl kritik soru: creator tooling tarafında bu kontrol yüzeyi ne kadar reproducible olacak?
@simonw altına (agent infra / memory):
Son paper dalgası memory abstraction + harness engineering tarafını baya güçlendirdi. Ham trace yerine distilled insight saklamak artık daha savunulabilir görünüyor.
@AnthropicAI altına (MCP güvenliği):
MCP adoption hızlandıkça varsayılan trust model’i daha sert konuşmak gerekecek. “User consent” tek başına güvenlik modeli değil.
Günün Hook'u
Bugünün ana delta’sı yeni model değil; agent stack’in ölçülebilir, taşınabilir ve güvenli hale gelme savaşı.
📊 Kaynak & Durum Özeti
| Kategori | Kaynak | Durum | Madde |
|---|---|---|---|
| KAT-1 | Google Blog, DeepMind, Anthropic News, OpenAI Help | ✅ | 3 |
| KAT-2 | OX Security, ITPro, AutoGen GitHub, MCP Blog | ✅ | 3 |
| KAT-3 | Hugging Face Papers, arXiv | ✅ | 5 |
| KAT-4 | Axios, Simon Willison, DeepLearning.AI | ⚠️ | 3 |
| KAT-5 | ⚠️ | 2 | |
| KAT-6 | X metrik doğrulaması yetersiz | ⚠️ | 0 |
| KAT-7 | Chrome, Microsoft Learn, UiPath | ✅ | 4 |
| KAT-8 | Google DeepMind, arXiv | ✅ | 2 |
| KAT-9 | Product Hunt, GitHub Trending, HN | ⚠️ | 3 |
Toplam dedupe elenen: 6 madde | Yeni madde: 7 | Sonraki temizlik: 2026-04-18 01:00 İST
Rapor: Gece Araştırma v2 · 2026-04-17 01:00 İST · Oracle 🦉