2026-05-07

🔬 Gece Araştırma — 2026-05-07 (Perşembe 01:01 İST)

Curate eden: Mahsum Aktaş · Günlük otomatik AI sektör taraması

🔬 Gece Araştırma — 2026-05-07 (Perşembe 01:01 İST)

Yenilik Önceliği · 9/9 kategori · 36 kaynak aktif · Dedupe: 12 madde elendi

⚠️ KAT-5 Reddit skorları kısmen gizli döndü; doğrudan Reddit URL + üçüncü taraf canlı tarama snapshot’ı kullanıldı.
⚠️ KAT-6 X/Twitter için 1000 RT / 10k like eşiği bağımsız doğrulanamadı; medya tarafından doğrulanan viral tartışmalar işlendi.
⚠️ KAT-9 HN/GitHub/Product Hunt sayfaları açıldı ama bazı puan/repo/ürün listeleri extract edilemedi; ilgili alt bölümlerde işaretlendi.

🔥 Top 7 — Sadece GERÇEKTEN YENİ (Son 72 Saat Delta)

Bu bölüme yalnızca 72 saat içinde ilk kez raporlanan veya materyal olarak değişen maddeler girer.
Daha önce raporlanan konunun devamı → "→ Güncelleme:" etiketiyle altta göster.

#	Madde	Kategori	Kaynak	Önem
1	Anthropic, agent’lara “dreaming” tekniği getirdi — ajanların oturumlar arasında geçmiş davranışı gözden geçirip hata azaltması ve hafıza iyileştirmesi hedefleniyor. 🔗	KAT-1/KAT-2	Business Insider	🔴
2	Genesis AI, GENE-26.5 robot “brain” duyurdu — insan ölçeğinde dexterous hand + veri motoruyla fiziksel manipülasyon iddiası geldi. 🔗	KAT-8	PRNewswire	🔴
3	Apple’ın iOS 27’de üçüncü taraf AI model seçimi hazırladığı iddia edildi — Siri/OS seviyesinde model rekabeti App Store “Extensions” katmanına taşınabilir. 🔗	KAT-7	Bloomberg aktarımlı ToI	🟡
4	Anthropic, Claude Code talebi için SpaceX Colossus 1 kapasitesine yöneldi — 300 MW / 220k GPU ölçeği, agent ürünlerinde compute savaşının sertleştiğini gösteriyor. 🔗	KAT-1	MarketWatch/WSJ	🔴
5	ARIS HF Daily #1 oldu — cross-model adversarial reviewer + evidence-to-claim audit, otomatik araştırma sistemleri için doğrudan uygulanabilir. 🔗	KAT-3/KAT-2	Hugging Face	🔴
6	Chrome 148 stable: Prompt API ve yeni web platform değişiklikleri — on-device Gemini Nano erişimi ve CSS/web API güncellemeleri developer etkisi yaratıyor. 🔗	KAT-7	Chrome Developers	🟡
7	→ Güncelleme: GitHub MCP Server secret scanning GA oldu — MCP uyumlu agent/IDE içinde commit öncesi secret tarama üretime çıktı. 🔗	KAT-2/KAT-7	GitHub Changelog	🟡

Dedupe notu: Top 7’den elenen/eskiye düşenler: GPT-5.5 Instant default, CAISI model review, MolmoAct2, Mastra Durable Agents, MCP RCE alarmı, A2A 1.0 baseline, VS Code 1.116/1.117, Chrome 147, Windows 11 May agent taskbar, Familiar robot, Meta ARI acquisition, Product Hunt agent kümesi.

🤖 KAT-1 · AI Laboratuvarları & Model Haberleri

Anthropic “dreaming” tekniği: Managed Agents hattında araştırma önizlemesi; ajanların oturum arası refleksiyon/hafıza kazanması hedefleniyor. 🔗
Anthropic compute genişlemesi: Claude Code büyümesi, SpaceX Colossus 1 kapasitesi ve yeni usage limit artışıyla ilişkilendiriliyor. 🔗
→ Güncelleme: OpenAI GPT-5.5 ulusal güvenlik test erişimi: Chris Lehane paylaşımı üzerinden GPT-5.5’in ABD güvenlik değerlendirmesine erken verildiği aktarıldı; CAISI konusu önce raporlandığı için Top 7’ye alınmadı. 🔗
Dedupe: GPT-5.5 Instant default ve OpenAI/Anthropic enterprise JV başlıkları tekrar edilmedi. 🔗

🕸️ KAT-2 · Agent & Framework

Anthropic Managed Agents “dreaming”: Agent memory/reflection katmanını ürünleştirme sinyali. 🔗
GitHub MCP Server secret scanning GA: MCP agent workflow’larında exposed secret taraması commit/PR öncesine çekildi. 🔗
MCP STDIO güvenlik riski: RCE alarmı önce raporlandı; yeni raporda sadece bağlam olarak tutuldu, Top 7’ye alınmadı. 🔗
Mistral Workflows: Temporal destekli orchestration public preview geçen hafta çıktı; 72s delta olmadığı için alt sinyal. 🔗

📄 KAT-3 · Makaleler & Araştırma

arXiv ID	Başlık	Neden Önemli	Kaynak
2605.03042	ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration	Cross-family reviewer + claim audit, Oracle araştırma motoruna direkt kalıp.	HF
2605.04036	OpenSeeker-v2	10.6k SFT trajectory ile search agent SOTA iddiası; pahalı RL hattına alternatif.	HF
2605.02396	HeavySkill	Parallel reasoning + summarization’ı harness değil model içi beceri gibi ele alıyor.	HF
2605.02801	RL for LLM-based Multi-Agent Systems through Orchestration Traces	Spawn/delegate/aggregate/stop kararlarını RL credit assignment problemine çeviriyor.	HF
2605.03596	Workspace-Bench 1.0	Büyük dosya bağımlılıklarında agent performans açığını ölçüyor; gerçek workspace testi.	HF
2605.03941	iWorld-Bench	Interactive world model’lar için 330k video / 4.9k test görevi benchmark’ı.	HF
2604.28123	PRISM	Multimodal RL öncesi distribution alignment; SFT→RL drift sorununa çözüm.	HF
2605.01371	ESARBench	UAV embodied search-and-rescue ajanlarını değerlendiren yeni benchmark.	Arxiv Troller

Oracle için çıkarım: ARIS + Workspace-Bench + orchestration traces birlikte kullanılmalı: iddia defteri, kanıt eşleme, workspace bağımlılık testi ve reviewer-agent gate.

🧠 KAT-4 · Düşünce Liderleri

Kişi	Görüş Özeti	Tarih	Kaynak
Simon Willison	“Vibe coding” ile agentic engineering’in pratikte birbirine yaklaştığını yazdı; outbound agent eylemlerinde human-in-loop vurgusu yaptı.	2026-05-06	simonwillison.net
Yann LeCun	AI iş kıyameti söylemlerinin öğrencilere zarar verdiğini, CEO hype’ına kör güvenilmemesi gerektiğini söyledi.	2026-05-05/06	Fortune
Sam Altman	GPT-5.5’in kendi launch party planlama davranışını “strange” örnek olarak anlattı; model kişiselleşmesi tartışması büyüdü.	2026-05-03/05	Business Insider
Dario Amodei	Claude Code kaynaklı büyümenin compute sınırına dayandığını ve adoption’ın mühendislikten başladığını vurguladı.	2026-05-06	Business Insider

🔴 KAT-5 · Reddit Viral

Subreddit	Başlık	Upvote	Kaynak
r/sysadmin	Microsoft AI Tour sonrası enterprise “agent” yorgunluğu	≈670	DEV tarama
r/OpenAI	Is Codex the best right now?	≈495+ / çok yorum	Reddit
r/codex	OpenAI Codex Surpasses Claude Code in Downloads	≈393+	Reddit
r/LocalLLaMA	DeepSeek V4 Pro matches GPT-5.2 on FoodTruck Bench	≈291	Reddit
r/LocalLLaMA	Qwen3.6-27B + local agentic search SimpleQA iddiası	≈428	DEV tarama

🐦 KAT-6 · Twitter/X Viral

Hesap	Tweet Özeti	Etki	Tarih
@sama / OpenAI çevresi	GPT-5.5 party ve modelin kendi event akışını önermesi X/tech çevresinde viral tartışmaya döndü.	Metrik doğrulanamadı; medya “viral tech moment” dedi.	2026-05-05/06
Anthropic / Claude Code çevresi	“Dreaming”, Managed Agents ve Claude Code büyümesi etrafında agent memory tartışması büyüdü.	RT/like eşiği doğrulanamadı.	2026-05-06
Boris Cherny / Anthropic	“Manual code writing bitti” çizgisi yeniden dolaşıma girdi; software engineering tartışmasını kızıştırdı.	Medya yayılımı var, X metrik yok.	2026-05-06

⚠️ KAT-6 Kaynak Hatası: X metrikleri CDP/X erişimi olmadan doğrulanamadı. Kullanılan kaynaklar: BI GPT-5.5 party, BI Anthropic dreaming, ToI Boris Cherny

🌐 KAT-7 · Platform & Ekosistem

Chrome 148 stable: Prompt API, CSS name-only container queries ve feature detection güncellemeleri geldi. 🔗
VS Code 1.119: Resmi update sayfası AI agents + integrated browser ile web app build/test akışını öne çıkarıyor. 🔗
GitHub MCP secret scanning GA: Agent/IDE içinden secret scanning artık genel erişimde. 🔗
Apple iOS 27 “Extensions” iddiası: Kullanıcıların Siri/OS için üçüncü taraf model seçebilmesi platform rekabetini değiştirebilir. 🔗
Dedupe: Chrome 147, Firefox WebExtensions 149-152 ve Windows 11 May update önceki raporda olduğu için Top 7’ye alınmadı. 🔗

🦾 KAT-8 · Robotik & Edge AI

Genesis AI GENE-26.5: Şirket, robotlar için fiziksel manipülasyon odaklı foundation model + dexterous hand veri sistemi duyurdu. 🔗
iWorld-Bench: Interactive world model değerlendirmesi için büyük video/test benchmark’ı çıktı. 🔗
ESARBench: UAV embodied search-and-rescue ajanları için yeni benchmark. 🔗
Dedupe: Familiar robot companion önce raporlandı; yeni coverage materyal değişiklik yaratmadı. 🔗
Dedupe: Meta ARI acquisition önce raporlandı; Top 7 dışında tutuldu. 🔗

⭐ KAT-9 · OSS & Ürün Sinyalleri

HN Öne Çıkanlar

Puan	Başlık	Kaynak
⚠️ doğrulanamadı	Our AI started a cafe in Stockholm — AI manager deneyinde human-in-loop etik tartışması	Simon/HN linkli not
⚠️ doğrulanamadı	Agent/Codex/Claude Code tartışmaları HN ve Reddit’e taşındı	HN

GitHub Trending

Repo	Stars/Gün	Alan
⚠️ Kaynak extract hatası	GitHub Python daily trending açıldı ama repo satırları alınamadı	GitHub Python Trending
⚠️ Kaynak extract hatası	GitHub TypeScript daily trending açıldı ama repo satırları alınamadı	GitHub TS Trending
ARIS	8.12k toplam yıldız	Research agent harness
OpenSeeker-v2	629 toplam yıldız	Search agent training

Product Hunt AI

⚠️ KAT-9 Kaynak Hatası: Product Hunt AI sayfası dinamik içerik nedeniyle ürün listesi döndürmedi. Kaynak denendi: Product Hunt AI

🇹🇷 Türk Tech Sahnesi

Bu dönemde Türkiye bağlantılı özel AI/agent/robotik gelişme tespit edilmedi.

⚠️ Bonus kaynak notu: “Türkiye yapay zeka AI haber 2026-05-07 / technopat AI haber” araması belirgin yeni madde döndürmedi.

🧠 Oracle Self-Improvement Sinyalleri

#	Bulgu	Kaynak	Uygulama Alanı	Efor
1	Cross-model adversarial reviewer + claim ledger araştırma hatalarını azaltır.	ARIS	gece-arastirma / rapor doğrulama	Orta
2	MCP secret scanning agent workflow içine alınmalı; commit/cron öncesi secret gate.	GitHub MCP	scripts / MCP config / governance	Küçük
3	Workspace-Bench tarzı büyük dosya bağımlılığı testi Oracle doğrulama suite’ine uyarlanmalı.	Workspace-Bench	verification-gate / reviewer	Orta

🐦 CikCik Paketi (@muxamos sesi)

Tweetler (3–5 adet)

Tweet 1 (Konu: Anthropic dreaming):

Agent’ların “dreaming” fikri hype gibi duruyor ama asıl mesele basit: sistem oturum bitince ne öğrendiğini düzgün çıkarabiliyor mu? Memory yoksa agent değil, uzun promptlu chatbot.

Tweet 2 (Konu: GitHub MCP secret scanning):

MCP ekosistemi büyüdükçe “tool bağladım çalıştı” dönemi bitiyor. GitHub’ın MCP secret scanning GA hamlesi doğru yön: agent’a yetki vermeden önce sızıntı ve izin sınırı otomatik kontrol edilmeli.

Tweet 3 (Konu: ARIS):

ARIS’in iyi tarafı “AI research yapıyor” demesi değil; evidence-to-claim audit koyması. Agent raporunda asıl problem cevap üretmek değil, iddianın kanıtla gerçekten bağlı kalması.

Tweet 4 (Konu: Chrome 148 Prompt API):

Chrome 148 ile on-device Prompt API stable sinyali önemli. Web tarafında model çağırmak yavaş yavaş “uzak API isteği” olmaktan çıkıp tarayıcı primitive’ine dönüşüyor.

Reply Fırsatları (2–3)

@simonw altına (agent etik):

Katılıyorum. Agent deneyleri gerçek dünyada üçüncü kişilerin zamanını tüketmeye başladığı anda “demo” olmaktan çıkıyor. Outbound action için human-in-loop şart.

@github altına (MCP secret scanning):

MCP için doğru hamle. Bir sonraki adım secret scanning + permission diff + tool manifest review’ı tek preflight gate altında birleştirmek olmalı.

@AnthropicAI altına (dreaming):

“Dreaming” ilginç ama ölçüt kritik: reflection gerçekten hata azaltıyor mu, yoksa sadece daha iyi anlatılmış session summary mi? Benchmark görmek lazım.

Günün Hook'u

Agent savaşında kazanan en zeki model değil; hafızası, kanıt disiplini ve güvenlik sınırı en iyi sistem olacak.

📊 Kaynak & Durum Özeti

Kategori	Kaynak	Durum	Madde
KAT-1	BI, MarketWatch, ET, TechCrunch	✅	4
KAT-2	GitHub, BI, VentureBeat, Mistral/VB	✅	4
KAT-3	Hugging Face Papers, arXiv mirror	✅	8
KAT-4	Simon Willison, Fortune, BI	✅	4
KAT-5	Reddit direct, DEV live scans	⚠️ skor kısıtlı	5
KAT-6	BI, ToI, TechTwitter context	⚠️ X metrik yok	3
KAT-7	Chrome Dev, VS Code, GitHub, Apple news	✅	5
KAT-8	PRNewswire, HF, TechCrunch, Verge	✅	5
KAT-9	HN, GitHub Trending, Product Hunt	⚠️ extract kısıtlı	4

Toplam dedupe elenen: 12 madde | Yeni madde: 34 | Sonraki temizlik: 2026-05-08 01:01 İST

Rapor: Gece Araştırma v2 · 2026-05-07 01:01 İST · Oracle 🦉