🔬 Gece Araştırma — 2026-05-14 (Perşembe 01:00 İST)
Curate eden: Mahsum Aktaş · Günlük otomatik AI sektör taraması
🔬 Gece Araştırma — 2026-05-14 (Perşembe 01:00 İST)
Yenilik Önceliği · 9/9 kategori · 24 kaynak aktif · Dedupe: 14 madde elendi
⚠️ KAT-6 X/Twitter viral metrikleri doğrulanamadı.
⚠️ KAT-9 HN/GitHub/Product Hunt sayfaları açıldı ama bazı liste detayları temiz metin olarak gelmedi.
⚠️ Türk Tech özel taraması güvenilir sonuç üretmedi.
🔥 Top 7 — Sadece GERÇEKTEN YENİ (Son 72 Saat Delta)
Bu bölüme yalnızca 72 saat içinde ilk kez raporlanan veya materyal olarak değişen maddeler girer. Daha önce raporlanan konunun devamı → "→ Güncelleme:" etiketiyle altta göster.
| # | Madde | Kategori | Kaynak | Önem |
|---|---|---|---|---|
| 1 | ToolCUA: GUI + tool path orchestration için yeni SOTA — Computer-use agent’ların ne zaman GUI, ne zaman API/tool kullanacağını RL ile eğitiyor; OSWorld-MCP’de %46.85 accuracy ve baseline’a göre ~%66 relatif artış bildiriyor. 🔗 | KAT-2/KAT-3 | HF/arXiv | 🔴 |
| 2 | MemPrivacy: edge-cloud agent memory için yerel gizlilik katmanı — PII/secrets verisini typed placeholder ile lokal maskeleyip cloud memory utility kaybını %1.6 altında tutmayı hedefliyor. 🔗 | KAT-2/KAT-3 | HF/arXiv | 🔴 |
| 3 | Google DeepMind “AI pointer” arayüzünü duyurdu — Mouse pointer’ın işaret ettiği UI bağlamını AI’a semantik kontrol yüzeyi yapmak istiyor; agent UX için yeni interaction primitive. 🔗 | KAT-1/KAT-7 | DeepMind | 🔴 |
| 4 | Multi-Stream LLMs: tek mesaj akışı yerine paralel düşünce/girdi/çıktı stream’i — Agent’ların okurken yazamama, düşünürken aksiyon alamama darboğazını model arayüzünden çözmeyi öneriyor. 🔗 | KAT-3 | HF/arXiv | 🔴 |
| 5 | FATE: failure trajectory ile agent safety self-evolution — Yanıt seviyesinde değil trajectory seviyesinde fail repair yapıyor; attack success rate’te %33.5 düşüş bildiriyor. 🔗 | KAT-2/KAT-3/KAT-7 | HF/arXiv | 🔴 |
| 6 | MCP-Cosmos: MCP ortamlarında world-model destekli agent execution — ReAct/SPIRAL + world model kombinasyonunu MCP-Bench üzerinde tool success ve parameter accuracy için ölçüyor. 🔗 | KAT-2/KAT-3 | arXiv | 🟡 |
| 7 | Anthropic’in yeni fonlama turu için $900B değerleme konuşuluyor — Claude talebi ve enterprise büyümesi üzerinden OpenAI ile fiyat/sermaye yarışı yeni seviyeye çıkıyor. 🔗 | KAT-1/KAT-9 | El País | 🟡 |
Dedupe notu: Chrome 148/Gemini Nano, Anthropic x SpaceX/xAI compute, OpenAI Deployment Company, AgentForesight, Shepherd, HyperEyes, AutoTTS, Genesis GENE-26.5, Meta ARI, Familiar robot ve HN hardware-attestation başlıkları Top 7’den elendi.
🤖 KAT-1 · AI Laboratuvarları & Model Haberleri
- Google DeepMind AI pointer — Pointer + voice + screen context ile AI’ın UI üzerindeki “neye bakıyorum/ne istiyorum” bağlamını anlamasını hedefliyor. 🔗
- Anthropic değerleme yarışı — El País, Anthropic’in yeni turda $900B değerleme konuştuğunu yazdı; laboratuvar rekabeti artık model kadar sermaye/compute kapasitesiyle ölçülüyor. 🔗
- Anthropic Claude Security public beta demo takvimi — Claude Security, codebase scan → finding validation → targeted patch akışıyla enterprise defender ürünü olarak konumlanıyor. 🔗
🕸️ KAT-2 · Agent & Framework
- ToolCUA — GUI action ve tool call arasında optimal geçişi öğrenen computer-use agent. 🔗
- MCP-Cosmos — MCP task execution için world model destekli planlama/ölçüm framework’ü. 🔗
- MCP Go SDK pre-release — OAuth client credentials handler, sampling-with-tools ve DNS rebinding koruması eklenmiş. 🔗
- Microsoft MCP catalog — Microsoft’un resmi MCP server katalog repo’su Mayıs başında yeni alpha template release aldı. 🔗
- MCP Registry v1.7.8 — MCP server registry app-store çizgisi güçleniyor. 🔗
📄 KAT-3 · Makaleler & Araştırma
| arXiv ID | Başlık | Neden Önemli | Kaynak |
|---|---|---|---|
| 2605.12481 | ToolCUA | GUI + API/tool hybrid agent training için doğrudan uygulanabilir SOTA sinyali. | 🔗 |
| 2605.09530 | MemPrivacy | Oracle/Hachi tarzı persistent memory sistemlerinde PII’yi cloud’a ham göndermeden memory utility koruma fikri. | 🔗 |
| 2605.12460 | Multi-Stream LLMs | Agent loop’un tek-token/tek-stream darboğazını mimari olarak kırmayı öneriyor. | 🔗 |
| 2605.11882 | On-Policy Self-Evolution via Failure Trajectories | Başarısız trajectory’yi safety/utility repair datasına çeviriyor. | 🔗 |
| 2605.09131 | MCP-Cosmos | MCP execution kalite metrikleri ve world-model destekli agent denemesi. | 🔗 |
| 2605.00080 | World Model for Robot Learning | Robot policy/planning/simulation için world-model literatürünü toparlıyor. | 🔗 |
| 2605.10653 | Embodied AI in Action | SAE World Congress 2026’den real-world robotics safety/trust/deployment notları. | 🔗 |
Oracle için çıkarım: Memory privacy + failure-trajectory repair + GUI/tool path seçimi doğrudan Hachi’nin cron, browser ve shell orchestration güvenliğine uygulanabilir.
🧠 KAT-4 · Düşünce Liderleri
| Kişi | Görüş Özeti | Tarih | Kaynak |
|---|---|---|---|
| Simon Willison | “11 AI agents” ifadesinin tek başına anlamsız olduğunu aktardı; agent sayısı değil görev/araç/state tasarımı önemli. | 2026-05-13 | 🔗 |
| Simon Willison | llm 0.32a2 notunda OpenAI Responses API’ye geçişin GPT-5 sınıfı modellerde interleaved reasoning/tool call için önemli olduğunu yazdı. | 2026-05-12 | 🔗 |
| Sam Altman | Musk davasında OpenAI’ın for-profit yapıya geçişini güvenli güçlü AI geliştirmek için sermaye gereksinimiyle savundu. | 2026-05-13 | 🔗 |
| Yann LeCun | AI CEO hype’ına mesafe, LLM reasoning sınırlılıkları ve “herkes agent yöneten boss olacak” çerçevesi. | 2026-05-04 | 🔗 |
🔴 KAT-5 · Reddit Viral
⚠️ Reddit logged-out HTML oy sayılarını maskeledi; 500+ eşik doğrulanamadı. Top/day listesinde görünen teknik başlıklar:
| Subreddit | Başlık | Upvote | Kaynak |
|---|---|---|---|
| r/MachineLearning | HALO-Loss: neural network’lere “I don’t know” abstain class fikri | ⚠️ Gizli | 🔗 |
| r/MachineLearning | TurboOCR: Paddle + TensorRT ile 270–1200 img/s OCR | ⚠️ Gizli | 🔗 |
| r/LocalLLaMA | OpenClaw 250K GitHub stars eleştirisi: “tek güvenilir use-case daily news digest” | ⚠️ Gizli | 🔗 |
🐦 KAT-6 · Twitter/X Viral
⚠️ KAT-6 Kaynak Hatası: X/Twitter viral metrikleri güvenilir şekilde doğrulanamadı; doğrudan X fetch yapılmadı.
| Hesap | Tweet Özeti | Etki | Tarih |
|---|---|---|---|
| @tobi / Shopify River | Simon Willison üzerinden görülen River notu: internal coding agent DM yerine public Slack channel’da çalışıyor; kurumsal öğrenme için görünürlük vurgusu. | Metrik doğrulanmadı | 🔗 |
🌐 KAT-7 · Platform & Ekosistem
- DeepMind AI pointer — OS/web UI interaction modeline yeni input primitive ekliyor. 🔗
- Chrome 148 stable — On-device inference/Prompt API hattı ve developer-facing browser AI yüzeyleri devam ediyor; bu başlık dedupe nedeniyle Top 7’ye alınmadı. 🔗
- Chrome 148 security patch hattı — PCWorld, 100+ vulnerability ve 3 critical fix bildirdi. 🔗
- VS Code 1.119 — Resmi release notes Apr 29; package tracker’da May 5/6 release sinyali. Dedupe nedeniyle Top 7’ye alınmadı. 🔗
- VS Code 1.120 package sinyali — PDQDeploy tracker May 13 package release gösteriyor; resmi release notes doğrulanamadı. 🔗
🦾 KAT-8 · Robotik & Edge AI
- Gabi robot monk — Unitree G1 tabanlı humanoid, Güney Kore’de Budist töreninde “robot monk” olarak kullanıldı; teknikten çok human-robot coexistence sinyali. 🔗
- World Model for Robot Learning survey — Robot policy, planning, simulation ve embodied agent evaluation için world-model haritası. 🔗
- Embodied AI in Action — SAE World Congress 2026 güvenlik/trust/deployment içgörüleri. 🔗
⭐ KAT-9 · OSS & Ürün Sinyalleri
HN Öne Çıkanlar
⚠️ HN sayfası açıldı ama puan/başlık detayları temiz metne güvenilir çıkmadı. 🔗
| Puan | Başlık | Kaynak |
|---|---|---|
| ⚠️ | HN top story verisi doğrulanamadı | 🔗 |
GitHub Trending
⚠️ GitHub daily trending Python/TypeScript sayfaları açıldı ama repo listesi temiz metne düşmedi.
| Repo | Stars/Gün | Alan |
|---|---|---|
| ⚠️ | ⚠️ | Python trending |
| ⚠️ | ⚠️ | TypeScript trending |
| modelcontextprotocol/registry | Günlük yıldız doğrulanmadı | MCP registry / agent tooling 🔗 |
| microsoft/mcp | Günlük yıldız doğrulanmadı | Official Microsoft MCP server catalog 🔗 |
Product Hunt AI
⚠️ Product Hunt AI kategori sayfası fetch hatası verdi. 🔗
🇹🇷 Türk Tech Sahnesi
⚠️ Türkiye bağlantılı özel gelişme güvenilir kaynakla doğrulanamadı. Bu bölüm için Technopat/Türkiye AI ve ilgili X hesapları taraması tamamlanamadı.
🧠 Oracle Self-Improvement Sinyalleri
| # | Bulgu | Kaynak | Uygulama Alanı | Efor |
|---|---|---|---|---|
| 1 | Memory’e PII typed-placeholder katmanı ekle | 🔗 | memory/, SESSION-STATE, cron logs | Orta |
| 2 | Agent failure trajectory’lerini self-repair datası olarak sakla | 🔗 | reflection/evolution loop | Orta |
| 3 | Browser automation’da GUI vs CLI/tool seçim politikasını ölç | 🔗 | CDP/browser + shell orchestration | Büyük |
🐦 CikCik Paketi (@muxamos sesi)
Tweetler (3–5 adet)
Tweet 1 (Konu: ToolCUA):
Agent meselesi “daha çok tool bağla” değil. Asıl eşik: ne zaman ekrana tıklayacak, ne zaman API çağıracak? ToolCUA bu switch kararını eğitmeye çalışıyor. Computer-use agent’larda gerçek darboğaz burada.
Tweet 2 (Konu: MemPrivacy):
Personal memory ürünleri patlayacaksa önce şu çözülmeli: cloud memory’ye ham PII/secrets göndermeden kişiselleştirme. MemPrivacy typed placeholder ile doğru yöne işaret ediyor.
Tweet 3 (Konu: Multi-Stream LLMs):
Chat formatı agent’lar için dar boğaz: model okurken yazamıyor, düşünürken aksiyon alamıyor. Multi-stream LLM fikri “daha uzun context”ten daha temel bir arayüz değişimi.
Tweet 4 (Konu: DeepMind pointer):
DeepMind’in AI pointer fikri küçük görünür ama UX açısından büyük: prompt yazmak yerine “şuna bak, bunu taşı, burayı değiştir” dönemi. Agent arayüzü chat kutusundan çıkıyor.
Reply Fırsatları (2–3)
@simonw altına (agent tanımı):
“11 agents” gerçekten metrik değil. Bence raporlanması gereken şey: state paylaşımı, tool boundary, failure recovery ve human-in-loop noktaları.
@LangChainAI / agent framework tartışmalarına:
Framework karşılaştırmasından önce ölçülmesi gereken şey GUI/tool switching policy. ToolCUA tarzı eval’ler production agent kalitesi için daha net sinyal veriyor.
Günün Hook'u
Agent sayısı değil, agent’ın ne zaman duracağını ve hangi yolu seçeceğini bilmesi değer yaratıyor.
📊 Kaynak & Durum Özeti
| Kategori | Kaynak | Durum | Madde |
|---|---|---|---|
| KAT-1 | DeepMind, El País, Anthropic | ✅ | 3 |
| KAT-2 | HF/arXiv, GitHub MCP repos | ✅ | 5 |
| KAT-3 | Hugging Face Daily Papers, arXiv | ✅ | 7 |
| KAT-4 | Simon Willison, Axios | ✅ | 4 |
| KAT-5 | Reddit top/day | ⚠️ | 3 |
| KAT-6 | X/Twitter via web | ⚠️ | 1 doğrulanmamış |
| KAT-7 | Chrome Dev, PCWorld, VS Code | ✅ | 5 |
| KAT-8 | TechRadar, HF/arXiv | ✅ | 3 |
| KAT-9 | HN, GitHub Trending, Product Hunt | ⚠️ | 4 hata/sinyal |
Toplam dedupe elenen: 14 madde | Yeni madde: 24 | Sonraki temizlik: 2026-05-17 01:00 İST
Rapor: Gece Araştırma v2 · 2026-05-14 01:00 İST · Oracle 🦉