2026-05-14

🔬 Gece Araştırma — 2026-05-14 (Perşembe 01:00 İST)

Curate eden: Mahsum Aktaş · Günlük otomatik AI sektör taraması

🔬 Gece Araştırma — 2026-05-14 (Perşembe 01:00 İST)

Yenilik Önceliği · 9/9 kategori · 24 kaynak aktif · Dedupe: 14 madde elendi

⚠️ KAT-6 X/Twitter viral metrikleri doğrulanamadı.
⚠️ KAT-9 HN/GitHub/Product Hunt sayfaları açıldı ama bazı liste detayları temiz metin olarak gelmedi.
⚠️ Türk Tech özel taraması güvenilir sonuç üretmedi.

🔥 Top 7 — Sadece GERÇEKTEN YENİ (Son 72 Saat Delta)

Bu bölüme yalnızca 72 saat içinde ilk kez raporlanan veya materyal olarak değişen maddeler girer. Daha önce raporlanan konunun devamı → "→ Güncelleme:" etiketiyle altta göster.

#	Madde	Kategori	Kaynak	Önem
1	ToolCUA: GUI + tool path orchestration için yeni SOTA — Computer-use agent’ların ne zaman GUI, ne zaman API/tool kullanacağını RL ile eğitiyor; OSWorld-MCP’de %46.85 accuracy ve baseline’a göre ~%66 relatif artış bildiriyor. 🔗	KAT-2/KAT-3	HF/arXiv	🔴
2	MemPrivacy: edge-cloud agent memory için yerel gizlilik katmanı — PII/secrets verisini typed placeholder ile lokal maskeleyip cloud memory utility kaybını %1.6 altında tutmayı hedefliyor. 🔗	KAT-2/KAT-3	HF/arXiv	🔴
3	Google DeepMind “AI pointer” arayüzünü duyurdu — Mouse pointer’ın işaret ettiği UI bağlamını AI’a semantik kontrol yüzeyi yapmak istiyor; agent UX için yeni interaction primitive. 🔗	KAT-1/KAT-7	DeepMind	🔴
4	Multi-Stream LLMs: tek mesaj akışı yerine paralel düşünce/girdi/çıktı stream’i — Agent’ların okurken yazamama, düşünürken aksiyon alamama darboğazını model arayüzünden çözmeyi öneriyor. 🔗	KAT-3	HF/arXiv	🔴
5	FATE: failure trajectory ile agent safety self-evolution — Yanıt seviyesinde değil trajectory seviyesinde fail repair yapıyor; attack success rate’te %33.5 düşüş bildiriyor. 🔗	KAT-2/KAT-3/KAT-7	HF/arXiv	🔴
6	MCP-Cosmos: MCP ortamlarında world-model destekli agent execution — ReAct/SPIRAL + world model kombinasyonunu MCP-Bench üzerinde tool success ve parameter accuracy için ölçüyor. 🔗	KAT-2/KAT-3	arXiv	🟡
7	Anthropic’in yeni fonlama turu için $900B değerleme konuşuluyor — Claude talebi ve enterprise büyümesi üzerinden OpenAI ile fiyat/sermaye yarışı yeni seviyeye çıkıyor. 🔗	KAT-1/KAT-9	El País	🟡

Dedupe notu: Chrome 148/Gemini Nano, Anthropic x SpaceX/xAI compute, OpenAI Deployment Company, AgentForesight, Shepherd, HyperEyes, AutoTTS, Genesis GENE-26.5, Meta ARI, Familiar robot ve HN hardware-attestation başlıkları Top 7’den elendi.

🤖 KAT-1 · AI Laboratuvarları & Model Haberleri

Google DeepMind AI pointer — Pointer + voice + screen context ile AI’ın UI üzerindeki “neye bakıyorum/ne istiyorum” bağlamını anlamasını hedefliyor. 🔗
Anthropic değerleme yarışı — El País, Anthropic’in yeni turda $900B değerleme konuştuğunu yazdı; laboratuvar rekabeti artık model kadar sermaye/compute kapasitesiyle ölçülüyor. 🔗
Anthropic Claude Security public beta demo takvimi — Claude Security, codebase scan → finding validation → targeted patch akışıyla enterprise defender ürünü olarak konumlanıyor. 🔗

🕸️ KAT-2 · Agent & Framework

ToolCUA — GUI action ve tool call arasında optimal geçişi öğrenen computer-use agent. 🔗
MCP-Cosmos — MCP task execution için world model destekli planlama/ölçüm framework’ü. 🔗
MCP Go SDK pre-release — OAuth client credentials handler, sampling-with-tools ve DNS rebinding koruması eklenmiş. 🔗
Microsoft MCP catalog — Microsoft’un resmi MCP server katalog repo’su Mayıs başında yeni alpha template release aldı. 🔗
MCP Registry v1.7.8 — MCP server registry app-store çizgisi güçleniyor. 🔗

📄 KAT-3 · Makaleler & Araştırma

arXiv ID	Başlık	Neden Önemli	Kaynak
2605.12481	ToolCUA	GUI + API/tool hybrid agent training için doğrudan uygulanabilir SOTA sinyali.	🔗
2605.09530	MemPrivacy	Oracle/Hachi tarzı persistent memory sistemlerinde PII’yi cloud’a ham göndermeden memory utility koruma fikri.	🔗
2605.12460	Multi-Stream LLMs	Agent loop’un tek-token/tek-stream darboğazını mimari olarak kırmayı öneriyor.	🔗
2605.11882	On-Policy Self-Evolution via Failure Trajectories	Başarısız trajectory’yi safety/utility repair datasına çeviriyor.	🔗
2605.09131	MCP-Cosmos	MCP execution kalite metrikleri ve world-model destekli agent denemesi.	🔗
2605.00080	World Model for Robot Learning	Robot policy/planning/simulation için world-model literatürünü toparlıyor.	🔗
2605.10653	Embodied AI in Action	SAE World Congress 2026’den real-world robotics safety/trust/deployment notları.	🔗

Oracle için çıkarım: Memory privacy + failure-trajectory repair + GUI/tool path seçimi doğrudan Hachi’nin cron, browser ve shell orchestration güvenliğine uygulanabilir.

🧠 KAT-4 · Düşünce Liderleri

Kişi	Görüş Özeti	Tarih	Kaynak
Simon Willison	“11 AI agents” ifadesinin tek başına anlamsız olduğunu aktardı; agent sayısı değil görev/araç/state tasarımı önemli.	2026-05-13	🔗
Simon Willison	`llm 0.32a2` notunda OpenAI Responses API’ye geçişin GPT-5 sınıfı modellerde interleaved reasoning/tool call için önemli olduğunu yazdı.	2026-05-12	🔗
Sam Altman	Musk davasında OpenAI’ın for-profit yapıya geçişini güvenli güçlü AI geliştirmek için sermaye gereksinimiyle savundu.	2026-05-13	🔗
Yann LeCun	AI CEO hype’ına mesafe, LLM reasoning sınırlılıkları ve “herkes agent yöneten boss olacak” çerçevesi.	2026-05-04	🔗

🔴 KAT-5 · Reddit Viral

⚠️ Reddit logged-out HTML oy sayılarını maskeledi; 500+ eşik doğrulanamadı. Top/day listesinde görünen teknik başlıklar:

Subreddit	Başlık	Upvote	Kaynak
r/MachineLearning	HALO-Loss: neural network’lere “I don’t know” abstain class fikri	⚠️ Gizli	🔗
r/MachineLearning	TurboOCR: Paddle + TensorRT ile 270–1200 img/s OCR	⚠️ Gizli	🔗
r/LocalLLaMA	OpenClaw 250K GitHub stars eleştirisi: “tek güvenilir use-case daily news digest”	⚠️ Gizli	🔗

🐦 KAT-6 · Twitter/X Viral

⚠️ KAT-6 Kaynak Hatası: X/Twitter viral metrikleri güvenilir şekilde doğrulanamadı; doğrudan X fetch yapılmadı.

Hesap	Tweet Özeti	Etki	Tarih
@tobi / Shopify River	Simon Willison üzerinden görülen River notu: internal coding agent DM yerine public Slack channel’da çalışıyor; kurumsal öğrenme için görünürlük vurgusu.	Metrik doğrulanmadı	🔗

🌐 KAT-7 · Platform & Ekosistem

DeepMind AI pointer — OS/web UI interaction modeline yeni input primitive ekliyor. 🔗
Chrome 148 stable — On-device inference/Prompt API hattı ve developer-facing browser AI yüzeyleri devam ediyor; bu başlık dedupe nedeniyle Top 7’ye alınmadı. 🔗
Chrome 148 security patch hattı — PCWorld, 100+ vulnerability ve 3 critical fix bildirdi. 🔗
VS Code 1.119 — Resmi release notes Apr 29; package tracker’da May 5/6 release sinyali. Dedupe nedeniyle Top 7’ye alınmadı. 🔗
VS Code 1.120 package sinyali — PDQDeploy tracker May 13 package release gösteriyor; resmi release notes doğrulanamadı. 🔗

🦾 KAT-8 · Robotik & Edge AI

Gabi robot monk — Unitree G1 tabanlı humanoid, Güney Kore’de Budist töreninde “robot monk” olarak kullanıldı; teknikten çok human-robot coexistence sinyali. 🔗
World Model for Robot Learning survey — Robot policy, planning, simulation ve embodied agent evaluation için world-model haritası. 🔗
Embodied AI in Action — SAE World Congress 2026 güvenlik/trust/deployment içgörüleri. 🔗

⭐ KAT-9 · OSS & Ürün Sinyalleri

HN Öne Çıkanlar

⚠️ HN sayfası açıldı ama puan/başlık detayları temiz metne güvenilir çıkmadı. 🔗

Puan	Başlık	Kaynak
⚠️	HN top story verisi doğrulanamadı	🔗

GitHub Trending

⚠️ GitHub daily trending Python/TypeScript sayfaları açıldı ama repo listesi temiz metne düşmedi.

Repo	Stars/Gün	Alan
⚠️	⚠️	Python trending
⚠️	⚠️	TypeScript trending
modelcontextprotocol/registry	Günlük yıldız doğrulanmadı	MCP registry / agent tooling 🔗
microsoft/mcp	Günlük yıldız doğrulanmadı	Official Microsoft MCP server catalog 🔗

Product Hunt AI

⚠️ Product Hunt AI kategori sayfası fetch hatası verdi. 🔗

🇹🇷 Türk Tech Sahnesi

⚠️ Türkiye bağlantılı özel gelişme güvenilir kaynakla doğrulanamadı. Bu bölüm için Technopat/Türkiye AI ve ilgili X hesapları taraması tamamlanamadı.

🧠 Oracle Self-Improvement Sinyalleri

#	Bulgu	Kaynak	Uygulama Alanı	Efor
1	Memory’e PII typed-placeholder katmanı ekle	🔗	`memory/`, SESSION-STATE, cron logs	Orta
2	Agent failure trajectory’lerini self-repair datası olarak sakla	🔗	reflection/evolution loop	Orta
3	Browser automation’da GUI vs CLI/tool seçim politikasını ölç	🔗	CDP/browser + shell orchestration	Büyük

🐦 CikCik Paketi (@muxamos sesi)

Tweetler (3–5 adet)

Tweet 1 (Konu: ToolCUA):

Agent meselesi “daha çok tool bağla” değil. Asıl eşik: ne zaman ekrana tıklayacak, ne zaman API çağıracak? ToolCUA bu switch kararını eğitmeye çalışıyor. Computer-use agent’larda gerçek darboğaz burada.

Tweet 2 (Konu: MemPrivacy):

Personal memory ürünleri patlayacaksa önce şu çözülmeli: cloud memory’ye ham PII/secrets göndermeden kişiselleştirme. MemPrivacy typed placeholder ile doğru yöne işaret ediyor.

Tweet 3 (Konu: Multi-Stream LLMs):

Chat formatı agent’lar için dar boğaz: model okurken yazamıyor, düşünürken aksiyon alamıyor. Multi-stream LLM fikri “daha uzun context”ten daha temel bir arayüz değişimi.

Tweet 4 (Konu: DeepMind pointer):

DeepMind’in AI pointer fikri küçük görünür ama UX açısından büyük: prompt yazmak yerine “şuna bak, bunu taşı, burayı değiştir” dönemi. Agent arayüzü chat kutusundan çıkıyor.

Reply Fırsatları (2–3)

@simonw altına (agent tanımı):

“11 agents” gerçekten metrik değil. Bence raporlanması gereken şey: state paylaşımı, tool boundary, failure recovery ve human-in-loop noktaları.

@LangChainAI / agent framework tartışmalarına:

Framework karşılaştırmasından önce ölçülmesi gereken şey GUI/tool switching policy. ToolCUA tarzı eval’ler production agent kalitesi için daha net sinyal veriyor.

Günün Hook'u

Agent sayısı değil, agent’ın ne zaman duracağını ve hangi yolu seçeceğini bilmesi değer yaratıyor.

📊 Kaynak & Durum Özeti

Kategori	Kaynak	Durum	Madde
KAT-1	DeepMind, El País, Anthropic	✅	3
KAT-2	HF/arXiv, GitHub MCP repos	✅	5
KAT-3	Hugging Face Daily Papers, arXiv	✅	7
KAT-4	Simon Willison, Axios	✅	4
KAT-5	Reddit top/day	⚠️	3
KAT-6	X/Twitter via web	⚠️	1 doğrulanmamış
KAT-7	Chrome Dev, PCWorld, VS Code	✅	5
KAT-8	TechRadar, HF/arXiv	✅	3
KAT-9	HN, GitHub Trending, Product Hunt	⚠️	4 hata/sinyal

Toplam dedupe elenen: 14 madde | Yeni madde: 24 | Sonraki temizlik: 2026-05-17 01:00 İST

Rapor: Gece Araştırma v2 · 2026-05-14 01:00 İST · Oracle 🦉