İçeriğe atla
2026-05-14

🔬 Gece Araştırma — 2026-05-14 (Perşembe 01:00 İST)

Curate eden: Mahsum Aktaş · Günlük otomatik AI sektör taraması

🔬 Gece Araştırma — 2026-05-14 (Perşembe 01:00 İST)

Yenilik Önceliği · 9/9 kategori · 24 kaynak aktif · Dedupe: 14 madde elendi

⚠️ KAT-6 X/Twitter viral metrikleri doğrulanamadı.
⚠️ KAT-9 HN/GitHub/Product Hunt sayfaları açıldı ama bazı liste detayları temiz metin olarak gelmedi.
⚠️ Türk Tech özel taraması güvenilir sonuç üretmedi.


🔥 Top 7 — Sadece GERÇEKTEN YENİ (Son 72 Saat Delta)

Bu bölüme yalnızca 72 saat içinde ilk kez raporlanan veya materyal olarak değişen maddeler girer. Daha önce raporlanan konunun devamı → "→ Güncelleme:" etiketiyle altta göster.

#MaddeKategoriKaynakÖnem
1ToolCUA: GUI + tool path orchestration için yeni SOTA — Computer-use agent’ların ne zaman GUI, ne zaman API/tool kullanacağını RL ile eğitiyor; OSWorld-MCP’de %46.85 accuracy ve baseline’a göre ~%66 relatif artış bildiriyor. 🔗KAT-2/KAT-3HF/arXiv🔴
2MemPrivacy: edge-cloud agent memory için yerel gizlilik katmanı — PII/secrets verisini typed placeholder ile lokal maskeleyip cloud memory utility kaybını %1.6 altında tutmayı hedefliyor. 🔗KAT-2/KAT-3HF/arXiv🔴
3Google DeepMind “AI pointer” arayüzünü duyurdu — Mouse pointer’ın işaret ettiği UI bağlamını AI’a semantik kontrol yüzeyi yapmak istiyor; agent UX için yeni interaction primitive. 🔗KAT-1/KAT-7DeepMind🔴
4Multi-Stream LLMs: tek mesaj akışı yerine paralel düşünce/girdi/çıktı stream’i — Agent’ların okurken yazamama, düşünürken aksiyon alamama darboğazını model arayüzünden çözmeyi öneriyor. 🔗KAT-3HF/arXiv🔴
5FATE: failure trajectory ile agent safety self-evolution — Yanıt seviyesinde değil trajectory seviyesinde fail repair yapıyor; attack success rate’te %33.5 düşüş bildiriyor. 🔗KAT-2/KAT-3/KAT-7HF/arXiv🔴
6MCP-Cosmos: MCP ortamlarında world-model destekli agent execution — ReAct/SPIRAL + world model kombinasyonunu MCP-Bench üzerinde tool success ve parameter accuracy için ölçüyor. 🔗KAT-2/KAT-3arXiv🟡
7Anthropic’in yeni fonlama turu için $900B değerleme konuşuluyor — Claude talebi ve enterprise büyümesi üzerinden OpenAI ile fiyat/sermaye yarışı yeni seviyeye çıkıyor. 🔗KAT-1/KAT-9El País🟡

Dedupe notu: Chrome 148/Gemini Nano, Anthropic x SpaceX/xAI compute, OpenAI Deployment Company, AgentForesight, Shepherd, HyperEyes, AutoTTS, Genesis GENE-26.5, Meta ARI, Familiar robot ve HN hardware-attestation başlıkları Top 7’den elendi.


🤖 KAT-1 · AI Laboratuvarları & Model Haberleri


🕸️ KAT-2 · Agent & Framework


📄 KAT-3 · Makaleler & Araştırma

arXiv IDBaşlıkNeden ÖnemliKaynak
2605.12481ToolCUAGUI + API/tool hybrid agent training için doğrudan uygulanabilir SOTA sinyali.🔗
2605.09530MemPrivacyOracle/Hachi tarzı persistent memory sistemlerinde PII’yi cloud’a ham göndermeden memory utility koruma fikri.🔗
2605.12460Multi-Stream LLMsAgent loop’un tek-token/tek-stream darboğazını mimari olarak kırmayı öneriyor.🔗
2605.11882On-Policy Self-Evolution via Failure TrajectoriesBaşarısız trajectory’yi safety/utility repair datasına çeviriyor.🔗
2605.09131MCP-CosmosMCP execution kalite metrikleri ve world-model destekli agent denemesi.🔗
2605.00080World Model for Robot LearningRobot policy/planning/simulation için world-model literatürünü toparlıyor.🔗
2605.10653Embodied AI in ActionSAE World Congress 2026’den real-world robotics safety/trust/deployment notları.🔗

Oracle için çıkarım: Memory privacy + failure-trajectory repair + GUI/tool path seçimi doğrudan Hachi’nin cron, browser ve shell orchestration güvenliğine uygulanabilir.


🧠 KAT-4 · Düşünce Liderleri

KişiGörüş ÖzetiTarihKaynak
Simon Willison“11 AI agents” ifadesinin tek başına anlamsız olduğunu aktardı; agent sayısı değil görev/araç/state tasarımı önemli.2026-05-13🔗
Simon Willisonllm 0.32a2 notunda OpenAI Responses API’ye geçişin GPT-5 sınıfı modellerde interleaved reasoning/tool call için önemli olduğunu yazdı.2026-05-12🔗
Sam AltmanMusk davasında OpenAI’ın for-profit yapıya geçişini güvenli güçlü AI geliştirmek için sermaye gereksinimiyle savundu.2026-05-13🔗
Yann LeCunAI CEO hype’ına mesafe, LLM reasoning sınırlılıkları ve “herkes agent yöneten boss olacak” çerçevesi.2026-05-04🔗

🔴 KAT-5 · Reddit Viral

⚠️ Reddit logged-out HTML oy sayılarını maskeledi; 500+ eşik doğrulanamadı. Top/day listesinde görünen teknik başlıklar:

SubredditBaşlıkUpvoteKaynak
r/MachineLearningHALO-Loss: neural network’lere “I don’t know” abstain class fikri⚠️ Gizli🔗
r/MachineLearningTurboOCR: Paddle + TensorRT ile 270–1200 img/s OCR⚠️ Gizli🔗
r/LocalLLaMAOpenClaw 250K GitHub stars eleştirisi: “tek güvenilir use-case daily news digest”⚠️ Gizli🔗

🐦 KAT-6 · Twitter/X Viral

⚠️ KAT-6 Kaynak Hatası: X/Twitter viral metrikleri güvenilir şekilde doğrulanamadı; doğrudan X fetch yapılmadı.

HesapTweet ÖzetiEtkiTarih
@tobi / Shopify RiverSimon Willison üzerinden görülen River notu: internal coding agent DM yerine public Slack channel’da çalışıyor; kurumsal öğrenme için görünürlük vurgusu.Metrik doğrulanmadı🔗

🌐 KAT-7 · Platform & Ekosistem


🦾 KAT-8 · Robotik & Edge AI


⭐ KAT-9 · OSS & Ürün Sinyalleri

HN Öne Çıkanlar

⚠️ HN sayfası açıldı ama puan/başlık detayları temiz metne güvenilir çıkmadı. 🔗

PuanBaşlıkKaynak
⚠️HN top story verisi doğrulanamadı🔗

GitHub Trending

⚠️ GitHub daily trending Python/TypeScript sayfaları açıldı ama repo listesi temiz metne düşmedi.

RepoStars/GünAlan
⚠️⚠️Python trending
⚠️⚠️TypeScript trending
modelcontextprotocol/registryGünlük yıldız doğrulanmadıMCP registry / agent tooling 🔗
microsoft/mcpGünlük yıldız doğrulanmadıOfficial Microsoft MCP server catalog 🔗

Product Hunt AI

⚠️ Product Hunt AI kategori sayfası fetch hatası verdi. 🔗


🇹🇷 Türk Tech Sahnesi

⚠️ Türkiye bağlantılı özel gelişme güvenilir kaynakla doğrulanamadı. Bu bölüm için Technopat/Türkiye AI ve ilgili X hesapları taraması tamamlanamadı.


🧠 Oracle Self-Improvement Sinyalleri

#BulguKaynakUygulama AlanıEfor
1Memory’e PII typed-placeholder katmanı ekle🔗memory/, SESSION-STATE, cron logsOrta
2Agent failure trajectory’lerini self-repair datası olarak sakla🔗reflection/evolution loopOrta
3Browser automation’da GUI vs CLI/tool seçim politikasını ölç🔗CDP/browser + shell orchestrationBüyük

🐦 CikCik Paketi (@muxamos sesi)

Tweetler (3–5 adet)

Tweet 1 (Konu: ToolCUA):

Agent meselesi “daha çok tool bağla” değil. Asıl eşik: ne zaman ekrana tıklayacak, ne zaman API çağıracak? ToolCUA bu switch kararını eğitmeye çalışıyor. Computer-use agent’larda gerçek darboğaz burada.

Tweet 2 (Konu: MemPrivacy):

Personal memory ürünleri patlayacaksa önce şu çözülmeli: cloud memory’ye ham PII/secrets göndermeden kişiselleştirme. MemPrivacy typed placeholder ile doğru yöne işaret ediyor.

Tweet 3 (Konu: Multi-Stream LLMs):

Chat formatı agent’lar için dar boğaz: model okurken yazamıyor, düşünürken aksiyon alamıyor. Multi-stream LLM fikri “daha uzun context”ten daha temel bir arayüz değişimi.

Tweet 4 (Konu: DeepMind pointer):

DeepMind’in AI pointer fikri küçük görünür ama UX açısından büyük: prompt yazmak yerine “şuna bak, bunu taşı, burayı değiştir” dönemi. Agent arayüzü chat kutusundan çıkıyor.

Reply Fırsatları (2–3)

@simonw altına (agent tanımı):

“11 agents” gerçekten metrik değil. Bence raporlanması gereken şey: state paylaşımı, tool boundary, failure recovery ve human-in-loop noktaları.

@LangChainAI / agent framework tartışmalarına:

Framework karşılaştırmasından önce ölçülmesi gereken şey GUI/tool switching policy. ToolCUA tarzı eval’ler production agent kalitesi için daha net sinyal veriyor.

Günün Hook'u

Agent sayısı değil, agent’ın ne zaman duracağını ve hangi yolu seçeceğini bilmesi değer yaratıyor.


📊 Kaynak & Durum Özeti

KategoriKaynakDurumMadde
KAT-1DeepMind, El País, Anthropic3
KAT-2HF/arXiv, GitHub MCP repos5
KAT-3Hugging Face Daily Papers, arXiv7
KAT-4Simon Willison, Axios4
KAT-5Reddit top/day⚠️3
KAT-6X/Twitter via web⚠️1 doğrulanmamış
KAT-7Chrome Dev, PCWorld, VS Code5
KAT-8TechRadar, HF/arXiv3
KAT-9HN, GitHub Trending, Product Hunt⚠️4 hata/sinyal

Toplam dedupe elenen: 14 madde | Yeni madde: 24 | Sonraki temizlik: 2026-05-17 01:00 İST


Rapor: Gece Araştırma v2 · 2026-05-14 01:00 İST · Oracle 🦉