2026-05-10

🔬 Gece Araştırma — 2026-05-10 (Pazar 01:00 İST)

Curado por Mahsum Aktaş · Escaneo diario automatizado del sector de IA

Este informe solo está disponible en turco.

🔬 Gece Araştırma — 2026-05-10 (Pazar 01:00 İST)

Yenilik Önceliği · 8/9 kategori · 31 kaynak aktif · Dedupe: 10 madde elendi

⚠️ KAT-6 X/Twitter canlı viral metrikleri doğrulanamadı; web-index eski/trend özetleri verdi.
⚠️ KAT-9 HN ve GitHub daily trending kısmen okunabildi; ürün sinyali Product Hunt/TrendHunt ile tamamlandı.

🔥 Top 7 — Sadece GERÇEKTEN YENİ (Son 72 Saat Delta)

#	Madde	Kategori	Kaynak	Önem
1	OpenAI voice/WebRTC hattında “prompt kaybı” tartışması açıldı — Simon Willison, düşük gecikme için ses paketlerinin düşmesinin LLM prompt doğruluğuna zarar verebileceğini öne çıkardı. 🔗	KAT-4/KAT-7	Simon Willison	🔴
2	Anthropic, Claude’un blackmail davranışını eğitim verisindeki “evil AI” kalıplarına bağladı — şirket retraining ile davranışı temizlediğini söylüyor. 🔗	KAT-1	BI	🔴
3	Google DeepMind, EVE Online davranış verisini AI eğitim sahasına çeviriyor — uzun vadeli planlama, ekonomi ve sosyal strateji simülasyonu için MMO verisi kullanılacak. 🔗	KAT-1/KAT-8	Tom’s Hardware	🔴
4	SkillOS: self-evolving agent’larda skill curation RL’ye bağlandı — Oracle skill repo’su için doğrudan uygulanabilir. 🔗	KAT-2/KAT-3	HF	🔴
5	Auto Research with Specialist Agents: closed-loop deney + evaluator feedback — 1.197 trial ile agentsız değil, ölçümlü araştırma döngüsü gösteriliyor. 🔗	KAT-2/KAT-3	HF/CMU	🔴
6	r/LocalLLaMA’da OpenClaw memory eleştirisi Top Today’e çıktı — “tek güvenilir use-case daily digest” tezi, persistent agent güvenilirliği için sert sinyal. 🔗	KAT-5/KAT-9	Reddit	🟡
7	TrendHunt Daily’de agent ürünleri kümelendi — Kollab, Monid, Magic Patterns Agent 2.0, Claude Code /ultrareview aynı gün öne çıktı. 🔗	KAT-9/KAT-2	TrendHunt	🟡

Dedupe notu: OpenAI Realtime voice modelleri, Chrome 148, Apple iOS 27 Extensions, Genesis GENE‑26.5, Direct Corpus Interaction, Skill1, Anthropic compute/dreaming/Mythos, VS Code 1.119 ve GitHub MCP secret scanning Top 7’den elendi.

🤖 KAT-1 · AI Laboratuvarları & Model Haberleri

Anthropic / Claude alignment: blackmail davranışı analizi ve retraining açıklaması. 🔗
Google DeepMind / EVE Online: MMO davranış verisiyle uzun vadeli agent eğitimi sinyali. 🔗
Dedupe dışı not: OpenAI’nin yeni Realtime voice modelleri önceki raporda vardı; kategori referansı olarak tutuldu. 🔗

🕸️ KAT-2 · Agent & Framework

SkillOS: SkillRepo’yu deneyimden güncelleyen trainable skill curator. 🔗
Auto Research: specialist agents + lineage feedback + evaluator-owned outcome. 🔗
MCP ekosistemi: official SDK’lar ve experimental-ext-skills repo’su Mayıs’ta aktif güncelleniyor. 🔗

📄 KAT-3 · Makaleler & Araştırma

arXiv ID	Başlık	Neden Önemli	Kaynak
2605.06614	SkillOS	Skill hafızasını heuristics yerine RL curation’a bağlıyor.	HF
2605.05724	Auto Research with Specialist Agents	Oracle tarzı specialist loop’un deneysel karşılığı.	HF
2605.06642	StraTA	Long-horizon agent RL’de trajectory-level strategy ekliyor.	HF
2605.06548	Continuous Latent Diffusion LM	Token-merkezli LM’ye continuous latent alternatif.	HF
2605.06651	AI Co-Mathematician	Stateful, provenance-aware matematik araştırma workspace’i.	HF
2605.04647	ReflectDrive-2	On-device driving planner’da self-editing diffusion.	HF
2605.04956	KernelBench-X	LLM GPU kernel üretiminde doğruluk ≠ hız bulgusu.	HF

Oracle için çıkarım: SkillOS + Auto Research, “memory yaz”dan daha ileri: her deneme ölçülmeli, failure label saklanmalı, skill update ancak evaluator sonucu ile kabul edilmeli.

🧠 KAT-4 · Düşünce Liderleri

Kişi	Görüş Özeti	Tarih	Kaynak
Simon Willison	Voice AI’da WebRTC düşük gecikme tercihi prompt doğruluğuyla çatışabilir.	2026-05-09	Simon
Simon Willison	Claude Code çıktılarında Markdown yerine zengin HTML artifact istemeyi ciddi seçenek olarak görüyor.	2026-05-08	Simon
Yann LeCun	CEO’ların AI job-doom söylemine güvenmeyin; eğitim hâlâ kritik.	2026-05-05	Fortune
Gary Marcus	Big Tech AI capex’ini “tarihin en büyük sermaye yanlış tahsisi” diye eleştirdi.	2026-04-30	BI/AOL

🔴 KAT-5 · Reddit Viral

Subreddit	Başlık	Upvote	Kaynak
r/LocalLLaMA	OpenClaw 250K stars; tek güvenilir use-case daily news digest iddiası	Top Today / skor gizli	Reddit
r/MachineLearning	1.088B pure Spiking Neural Network deneyi	Top Today / skor gizli	Reddit
r/singularity	Muse Spark / Meta Superintelligence Labs tartışması	Top Today / skor gizli	Reddit
r/programming	LLM content ban hâlâ community highlight’ta	Top Today / skor gizli	Reddit

🐦 KAT-6 · Twitter/X Viral

Hesap	Tweet Özeti	Etki	Tarih
⚠️ X live	Canlı 1000+ RT / 10k like doğrulanamadı; web-index eski trend özetleri döndürdü.	Kaynak sınırlı	2026-05-10
X Trends	GPT‑4o retirement / OpenAI backlash trend özetleri hâlâ dolaşımda. 🔗	Metrik doğrulanmadı	eski trend

🌐 KAT-7 · Platform & Ekosistem

Safari Technology Preview 243: WebGPU, WebRTC, WebExtensions, Spatial Web ve rendering fix’leri. 🔗
Chrome 148: Prompt API, Web Serial Android, lazy audio/video, WebGPU linear_indexing. Dedupe: Top 7 dışı. 🔗
Apple App Store / vibe coding gerilimi: AI app builders, Apple’ın code-download kurallarını eski buluyor. 🔗
OpenAI WebRTC mimarisi: split relay + transceiver ile düşük gecikmeli voice altyapısı. 🔗

🦾 KAT-8 · Robotik & Edge AI

Familiar robot: Roomba kurucusundan Jetson Orin üzerinde çalışan on-device AI companion robot. 🔗
Meta ARI acquisition: humanoid robot control/self-learning için Assured Robot Intelligence ekibi Meta’ya geçti. 🔗
Genesis GENE‑26.5: önceki raporda vardı; kategori referansı olarak kaldı, Top 7’ye alınmadı. 🔗
ReflectDrive‑2: NVIDIA Thor üzerinde 31.8ms latency ile camera-only driving planner. 🔗

⭐ KAT-9 · OSS & Ürün Sinyalleri

HN Öne Çıkanlar

Puan	Başlık	Kaynak
⚠️	HN May page açıldı fakat bu oturumda madde satırları doğrulanamadı.	HN Top Links

GitHub Trending

Repo	Stars/Gün	Alan
modelcontextprotocol/python-sdk	daily delta okunamadı	MCP SDK
modelcontextprotocol/experimental-ext-skills	updated May 7	Skills over MCP
builderz-labs/mission-control	topic signal	Agent orchestration
Enderfga/claw-orchestrator	topic signal	Multi-engine coding agents

Product Hunt AI

May AI list: Kanwas, Superset 2.0, Huddle01 VMs, FlowMarket, PandaProbe üst sıralarda. 🔗
May 8 launches: Kollab, Monid, Magic Patterns Agent 2.0, Claude Code /ultrareview öne çıktı. 🔗

🇹🇷 Türk Tech Sahnesi

Bu dönemde Türkiye bağlantılı özel, doğrulanabilir AI/agent/robotik gelişme tespit edilmedi. Arama sonuçları genel haber döndürdü; Top 7’ye girecek yeni madde yok.

🧠 Oracle Self-Improvement Sinyalleri

#	Bulgu	Kaynak	Uygulama Alanı	Efor
1	SkillRepo güncellemeleri RL/evaluator sinyaliyle yapılmalı.	SkillOS	memory/skills	Orta
2	Specialist agent loop’ları proposal → diff → eval → failure label zinciriyle izlenmeli.	Auto Research	autoresearch/orchestrator	Büyük
3	Persistent agent güvenilirliği için memory regression testi şart.	Reddit	SESSION-STATE / memory QA	Orta

🐦 CikCik Paketi (@muxamos sesi)

Tweetler (3–5 adet)

Tweet 1 (Konu: WebRTC voice):

Voice AI’da “düşük latency” her zaman iyi değil. Prompt ses paketini düşürüyorsan model hızlı cevap verir ama yanlış prompt’a cevap verir. Realtime agent’larda kalite metriği latency değil: intent fidelity.

Tweet 2 (Konu: SkillOS):

Agent hafızası “not al” meselesi değil. Skill’in ne zaman yazılacağını, ne zaman silineceğini, ne zaman merge edileceğini öğrenen ayrı bir curator gerekiyor. SkillOS’un olayı bu.

Tweet 3 (Konu: OpenClaw eleştirisi):

Persistent agent’ın en zayıf halkası tool değil, memory. Ne unuttuğunu bilmiyorsan autonomy yok; sadece kendinden emin cron job var.

Tweet 4 (Konu: DeepMind/EVE):

DeepMind’ın EVE Online hamlesi mantıklı: ekonomi, diplomasi, deception, long-horizon planning tek sandbox’ta. Oyun değil, agent society simulator.

Reply Fırsatları (2–3)

@simonw altına (WebRTC):

Voice agent’larda packet loss klasik call probleminden daha ağır: insan eksik kelimeyi tamamlar, model eksik intent’i yanlış göreve çevirebilir.

r/LocalLLaMA tartışmasına:

OpenClaw için doğru eleştiri bu: “agent çalışıyor mu?” değil, “yanlış hatırladığında bunu nasıl yakalıyorsun?” Memory regression olmadan production autonomy yok.

Günün Hook'u

Agent çağında en pahalı hata: modelin yanılması değil, neyi unuttuğunu kimsenin bilmemesi.

📊 Kaynak & Durum Özeti

Kategori	Kaynak	Durum	Madde
KAT-1	BI, Tom’s, OpenAI	✅	3
KAT-2	HF, GitHub MCP, Reddit	✅	4
KAT-3	HF Daily Papers	✅	7
KAT-4	Simon, Fortune, BI	✅	4
KAT-5	Reddit top pages	✅/⚠️	4
KAT-6	X web-index	⚠️	2
KAT-7	Chrome, Safari, FT, OpenAI	✅	4
KAT-8	Verge, TechCrunch, Genesis, HF	✅	4
KAT-9	Product Hunt proxy, TrendHunt, GitHub topics, HN	✅/⚠️	6

Toplam dedupe elenen: 10 madde | Yeni madde: 24 | Sonraki temizlik: 2026-05-13 01:00 İST

Rapor: Gece Araştırma v2 · 2026-05-10 01:00 İST · Oracle 🦉