🔬 Gece Araştırma — 2026-05-07 (Perşembe 01:01 İST)
Curate eden: Mahsum Aktaş · Günlük otomatik AI sektör taraması
🔬 Gece Araştırma — 2026-05-07 (Perşembe 01:01 İST)
Yenilik Önceliği · 9/9 kategori · 36 kaynak aktif · Dedupe: 12 madde elendi
⚠️ KAT-5 Reddit skorları kısmen gizli döndü; doğrudan Reddit URL + üçüncü taraf canlı tarama snapshot’ı kullanıldı.
⚠️ KAT-6 X/Twitter için 1000 RT / 10k like eşiği bağımsız doğrulanamadı; medya tarafından doğrulanan viral tartışmalar işlendi.
⚠️ KAT-9 HN/GitHub/Product Hunt sayfaları açıldı ama bazı puan/repo/ürün listeleri extract edilemedi; ilgili alt bölümlerde işaretlendi.
🔥 Top 7 — Sadece GERÇEKTEN YENİ (Son 72 Saat Delta)
Bu bölüme yalnızca 72 saat içinde ilk kez raporlanan veya materyal olarak değişen maddeler girer.
Daha önce raporlanan konunun devamı → "→ Güncelleme:" etiketiyle altta göster.
| # | Madde | Kategori | Kaynak | Önem |
|---|---|---|---|---|
| 1 | Anthropic, agent’lara “dreaming” tekniği getirdi — ajanların oturumlar arasında geçmiş davranışı gözden geçirip hata azaltması ve hafıza iyileştirmesi hedefleniyor. 🔗 | KAT-1/KAT-2 | Business Insider | 🔴 |
| 2 | Genesis AI, GENE-26.5 robot “brain” duyurdu — insan ölçeğinde dexterous hand + veri motoruyla fiziksel manipülasyon iddiası geldi. 🔗 | KAT-8 | PRNewswire | 🔴 |
| 3 | Apple’ın iOS 27’de üçüncü taraf AI model seçimi hazırladığı iddia edildi — Siri/OS seviyesinde model rekabeti App Store “Extensions” katmanına taşınabilir. 🔗 | KAT-7 | Bloomberg aktarımlı ToI | 🟡 |
| 4 | Anthropic, Claude Code talebi için SpaceX Colossus 1 kapasitesine yöneldi — 300 MW / 220k GPU ölçeği, agent ürünlerinde compute savaşının sertleştiğini gösteriyor. 🔗 | KAT-1 | MarketWatch/WSJ | 🔴 |
| 5 | ARIS HF Daily #1 oldu — cross-model adversarial reviewer + evidence-to-claim audit, otomatik araştırma sistemleri için doğrudan uygulanabilir. 🔗 | KAT-3/KAT-2 | Hugging Face | 🔴 |
| 6 | Chrome 148 stable: Prompt API ve yeni web platform değişiklikleri — on-device Gemini Nano erişimi ve CSS/web API güncellemeleri developer etkisi yaratıyor. 🔗 | KAT-7 | Chrome Developers | 🟡 |
| 7 | → Güncelleme: GitHub MCP Server secret scanning GA oldu — MCP uyumlu agent/IDE içinde commit öncesi secret tarama üretime çıktı. 🔗 | KAT-2/KAT-7 | GitHub Changelog | 🟡 |
Dedupe notu: Top 7’den elenen/eskiye düşenler: GPT-5.5 Instant default, CAISI model review, MolmoAct2, Mastra Durable Agents, MCP RCE alarmı, A2A 1.0 baseline, VS Code 1.116/1.117, Chrome 147, Windows 11 May agent taskbar, Familiar robot, Meta ARI acquisition, Product Hunt agent kümesi.
🤖 KAT-1 · AI Laboratuvarları & Model Haberleri
- Anthropic “dreaming” tekniği: Managed Agents hattında araştırma önizlemesi; ajanların oturum arası refleksiyon/hafıza kazanması hedefleniyor. 🔗
- Anthropic compute genişlemesi: Claude Code büyümesi, SpaceX Colossus 1 kapasitesi ve yeni usage limit artışıyla ilişkilendiriliyor. 🔗
- → Güncelleme: OpenAI GPT-5.5 ulusal güvenlik test erişimi: Chris Lehane paylaşımı üzerinden GPT-5.5’in ABD güvenlik değerlendirmesine erken verildiği aktarıldı; CAISI konusu önce raporlandığı için Top 7’ye alınmadı. 🔗
- Dedupe: GPT-5.5 Instant default ve OpenAI/Anthropic enterprise JV başlıkları tekrar edilmedi. 🔗
🕸️ KAT-2 · Agent & Framework
- Anthropic Managed Agents “dreaming”: Agent memory/reflection katmanını ürünleştirme sinyali. 🔗
- GitHub MCP Server secret scanning GA: MCP agent workflow’larında exposed secret taraması commit/PR öncesine çekildi. 🔗
- MCP STDIO güvenlik riski: RCE alarmı önce raporlandı; yeni raporda sadece bağlam olarak tutuldu, Top 7’ye alınmadı. 🔗
- Mistral Workflows: Temporal destekli orchestration public preview geçen hafta çıktı; 72s delta olmadığı için alt sinyal. 🔗
📄 KAT-3 · Makaleler & Araştırma
| arXiv ID | Başlık | Neden Önemli | Kaynak |
|---|---|---|---|
| 2605.03042 | ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration | Cross-family reviewer + claim audit, Oracle araştırma motoruna direkt kalıp. | HF |
| 2605.04036 | OpenSeeker-v2 | 10.6k SFT trajectory ile search agent SOTA iddiası; pahalı RL hattına alternatif. | HF |
| 2605.02396 | HeavySkill | Parallel reasoning + summarization’ı harness değil model içi beceri gibi ele alıyor. | HF |
| 2605.02801 | RL for LLM-based Multi-Agent Systems through Orchestration Traces | Spawn/delegate/aggregate/stop kararlarını RL credit assignment problemine çeviriyor. | HF |
| 2605.03596 | Workspace-Bench 1.0 | Büyük dosya bağımlılıklarında agent performans açığını ölçüyor; gerçek workspace testi. | HF |
| 2605.03941 | iWorld-Bench | Interactive world model’lar için 330k video / 4.9k test görevi benchmark’ı. | HF |
| 2604.28123 | PRISM | Multimodal RL öncesi distribution alignment; SFT→RL drift sorununa çözüm. | HF |
| 2605.01371 | ESARBench | UAV embodied search-and-rescue ajanlarını değerlendiren yeni benchmark. | Arxiv Troller |
Oracle için çıkarım: ARIS + Workspace-Bench + orchestration traces birlikte kullanılmalı: iddia defteri, kanıt eşleme, workspace bağımlılık testi ve reviewer-agent gate.
🧠 KAT-4 · Düşünce Liderleri
| Kişi | Görüş Özeti | Tarih | Kaynak |
|---|---|---|---|
| Simon Willison | “Vibe coding” ile agentic engineering’in pratikte birbirine yaklaştığını yazdı; outbound agent eylemlerinde human-in-loop vurgusu yaptı. | 2026-05-06 | simonwillison.net |
| Yann LeCun | AI iş kıyameti söylemlerinin öğrencilere zarar verdiğini, CEO hype’ına kör güvenilmemesi gerektiğini söyledi. | 2026-05-05/06 | Fortune |
| Sam Altman | GPT-5.5’in kendi launch party planlama davranışını “strange” örnek olarak anlattı; model kişiselleşmesi tartışması büyüdü. | 2026-05-03/05 | Business Insider |
| Dario Amodei | Claude Code kaynaklı büyümenin compute sınırına dayandığını ve adoption’ın mühendislikten başladığını vurguladı. | 2026-05-06 | Business Insider |
🔴 KAT-5 · Reddit Viral
| Subreddit | Başlık | Upvote | Kaynak |
|---|---|---|---|
| r/sysadmin | Microsoft AI Tour sonrası enterprise “agent” yorgunluğu | ≈670 | DEV tarama |
| r/OpenAI | Is Codex the best right now? | ≈495+ / çok yorum | |
| r/codex | OpenAI Codex Surpasses Claude Code in Downloads | ≈393+ | |
| r/LocalLLaMA | DeepSeek V4 Pro matches GPT-5.2 on FoodTruck Bench | ≈291 | |
| r/LocalLLaMA | Qwen3.6-27B + local agentic search SimpleQA iddiası | ≈428 | DEV tarama |
🐦 KAT-6 · Twitter/X Viral
| Hesap | Tweet Özeti | Etki | Tarih |
|---|---|---|---|
| @sama / OpenAI çevresi | GPT-5.5 party ve modelin kendi event akışını önermesi X/tech çevresinde viral tartışmaya döndü. | Metrik doğrulanamadı; medya “viral tech moment” dedi. | 2026-05-05/06 |
| Anthropic / Claude Code çevresi | “Dreaming”, Managed Agents ve Claude Code büyümesi etrafında agent memory tartışması büyüdü. | RT/like eşiği doğrulanamadı. | 2026-05-06 |
| Boris Cherny / Anthropic | “Manual code writing bitti” çizgisi yeniden dolaşıma girdi; software engineering tartışmasını kızıştırdı. | Medya yayılımı var, X metrik yok. | 2026-05-06 |
⚠️ KAT-6 Kaynak Hatası: X metrikleri CDP/X erişimi olmadan doğrulanamadı. Kullanılan kaynaklar: BI GPT-5.5 party, BI Anthropic dreaming, ToI Boris Cherny
🌐 KAT-7 · Platform & Ekosistem
- Chrome 148 stable: Prompt API, CSS name-only container queries ve feature detection güncellemeleri geldi. 🔗
- VS Code 1.119: Resmi update sayfası AI agents + integrated browser ile web app build/test akışını öne çıkarıyor. 🔗
- GitHub MCP secret scanning GA: Agent/IDE içinden secret scanning artık genel erişimde. 🔗
- Apple iOS 27 “Extensions” iddiası: Kullanıcıların Siri/OS için üçüncü taraf model seçebilmesi platform rekabetini değiştirebilir. 🔗
- Dedupe: Chrome 147, Firefox WebExtensions 149-152 ve Windows 11 May update önceki raporda olduğu için Top 7’ye alınmadı. 🔗
🦾 KAT-8 · Robotik & Edge AI
- Genesis AI GENE-26.5: Şirket, robotlar için fiziksel manipülasyon odaklı foundation model + dexterous hand veri sistemi duyurdu. 🔗
- iWorld-Bench: Interactive world model değerlendirmesi için büyük video/test benchmark’ı çıktı. 🔗
- ESARBench: UAV embodied search-and-rescue ajanları için yeni benchmark. 🔗
- Dedupe: Familiar robot companion önce raporlandı; yeni coverage materyal değişiklik yaratmadı. 🔗
- Dedupe: Meta ARI acquisition önce raporlandı; Top 7 dışında tutuldu. 🔗
⭐ KAT-9 · OSS & Ürün Sinyalleri
HN Öne Çıkanlar
| Puan | Başlık | Kaynak |
|---|---|---|
| ⚠️ doğrulanamadı | Our AI started a cafe in Stockholm — AI manager deneyinde human-in-loop etik tartışması | Simon/HN linkli not |
| ⚠️ doğrulanamadı | Agent/Codex/Claude Code tartışmaları HN ve Reddit’e taşındı | HN |
GitHub Trending
| Repo | Stars/Gün | Alan |
|---|---|---|
| ⚠️ Kaynak extract hatası | GitHub Python daily trending açıldı ama repo satırları alınamadı | GitHub Python Trending |
| ⚠️ Kaynak extract hatası | GitHub TypeScript daily trending açıldı ama repo satırları alınamadı | GitHub TS Trending |
| ARIS | 8.12k toplam yıldız | Research agent harness |
| OpenSeeker-v2 | 629 toplam yıldız | Search agent training |
Product Hunt AI
⚠️ KAT-9 Kaynak Hatası: Product Hunt AI sayfası dinamik içerik nedeniyle ürün listesi döndürmedi. Kaynak denendi: Product Hunt AI
🇹🇷 Türk Tech Sahnesi
Bu dönemde Türkiye bağlantılı özel AI/agent/robotik gelişme tespit edilmedi.
⚠️ Bonus kaynak notu: “Türkiye yapay zeka AI haber 2026-05-07 / technopat AI haber” araması belirgin yeni madde döndürmedi.
🧠 Oracle Self-Improvement Sinyalleri
| # | Bulgu | Kaynak | Uygulama Alanı | Efor |
|---|---|---|---|---|
| 1 | Cross-model adversarial reviewer + claim ledger araştırma hatalarını azaltır. | ARIS | gece-arastirma / rapor doğrulama | Orta |
| 2 | MCP secret scanning agent workflow içine alınmalı; commit/cron öncesi secret gate. | GitHub MCP | scripts / MCP config / governance | Küçük |
| 3 | Workspace-Bench tarzı büyük dosya bağımlılığı testi Oracle doğrulama suite’ine uyarlanmalı. | Workspace-Bench | verification-gate / reviewer | Orta |
🐦 CikCik Paketi (@muxamos sesi)
Tweetler (3–5 adet)
Tweet 1 (Konu: Anthropic dreaming):
Agent’ların “dreaming” fikri hype gibi duruyor ama asıl mesele basit: sistem oturum bitince ne öğrendiğini düzgün çıkarabiliyor mu? Memory yoksa agent değil, uzun promptlu chatbot.
Tweet 2 (Konu: GitHub MCP secret scanning):
MCP ekosistemi büyüdükçe “tool bağladım çalıştı” dönemi bitiyor. GitHub’ın MCP secret scanning GA hamlesi doğru yön: agent’a yetki vermeden önce sızıntı ve izin sınırı otomatik kontrol edilmeli.
Tweet 3 (Konu: ARIS):
ARIS’in iyi tarafı “AI research yapıyor” demesi değil; evidence-to-claim audit koyması. Agent raporunda asıl problem cevap üretmek değil, iddianın kanıtla gerçekten bağlı kalması.
Tweet 4 (Konu: Chrome 148 Prompt API):
Chrome 148 ile on-device Prompt API stable sinyali önemli. Web tarafında model çağırmak yavaş yavaş “uzak API isteği” olmaktan çıkıp tarayıcı primitive’ine dönüşüyor.
Reply Fırsatları (2–3)
@simonw altına (agent etik):
Katılıyorum. Agent deneyleri gerçek dünyada üçüncü kişilerin zamanını tüketmeye başladığı anda “demo” olmaktan çıkıyor. Outbound action için human-in-loop şart.
@github altına (MCP secret scanning):
MCP için doğru hamle. Bir sonraki adım secret scanning + permission diff + tool manifest review’ı tek preflight gate altında birleştirmek olmalı.
@AnthropicAI altına (dreaming):
“Dreaming” ilginç ama ölçüt kritik: reflection gerçekten hata azaltıyor mu, yoksa sadece daha iyi anlatılmış session summary mi? Benchmark görmek lazım.
Günün Hook'u
Agent savaşında kazanan en zeki model değil; hafızası, kanıt disiplini ve güvenlik sınırı en iyi sistem olacak.
📊 Kaynak & Durum Özeti
| Kategori | Kaynak | Durum | Madde |
|---|---|---|---|
| KAT-1 | BI, MarketWatch, ET, TechCrunch | ✅ | 4 |
| KAT-2 | GitHub, BI, VentureBeat, Mistral/VB | ✅ | 4 |
| KAT-3 | Hugging Face Papers, arXiv mirror | ✅ | 8 |
| KAT-4 | Simon Willison, Fortune, BI | ✅ | 4 |
| KAT-5 | Reddit direct, DEV live scans | ⚠️ skor kısıtlı | 5 |
| KAT-6 | BI, ToI, TechTwitter context | ⚠️ X metrik yok | 3 |
| KAT-7 | Chrome Dev, VS Code, GitHub, Apple news | ✅ | 5 |
| KAT-8 | PRNewswire, HF, TechCrunch, Verge | ✅ | 5 |
| KAT-9 | HN, GitHub Trending, Product Hunt | ⚠️ extract kısıtlı | 4 |
Toplam dedupe elenen: 12 madde | Yeni madde: 34 | Sonraki temizlik: 2026-05-08 01:01 İST
Rapor: Gece Araştırma v2 · 2026-05-07 01:01 İST · Oracle 🦉