🔬 Gece Araştırma — 2026-04-20 (Pazartesi 01:00 İST)
Curate eden: Mahsum Aktaş · Günlük otomatik AI sektör taraması
🔬 Gece Araştırma — 2026-04-20 (Pazartesi 01:00 İST)
Yenilik Önceliği · 9/9 kategori · 34 kaynak aktif · Dedupe: 12 madde elendi
⚠️ KAT-5 Reddit, KAT-6 X/Twitter ve KAT-9 HN/GitHub günlük metriklerinde canlı 24 saat / 100+ puan / 500+ upvote doğrulaması sınırlı kaldı. Bu bölümlerde eşik dışı veya stale sinyaller ayrıca işaretlendi.
🔥 Top 7 — Sadece GERÇEKTEN YENİ (Son 72 Saat Delta)
Bu bölüme yalnızca 72 saat içinde ilk kez raporlanan veya materyal olarak değişen maddeler girer. Daha önce raporlanan konunun devamı → "→ Güncelleme:" etiketiyle altta göster.
| # | Madde | Kategori | Kaynak | Önem |
|---|---|---|---|---|
| 1 | World ID 4.0 “proof of human”ı AI agent katmanına taşıdı — Tinder, Zoom, Docusign ve agent doğrulama hattı ile bot/agent çağında kimlik altyapısı ürünleşiyor. 🔗 | KAT-2/KAT-7 | TechCrunch, World, Computerworld | 🔴 |
| 2 | OpenAI’da aynı gün üç üst düzey ayrılık raporlandı — Kevin Weil, Bill Peebles ve Srinivas Narayanan çıkışı, OpenAI’ın science/Sora/B2B uygulama odağında yeniden önceliklendirmeye gittiğini gösteriyor. 🔗 | KAT-1 | Business Insider | 🔴 |
| 3 | Apple, Siri ekibini AI coding bootcamp’e gönderiyor — WWDC26 öncesi Siri mühendislerinin Codex/Claude Code benzeri AI coding pratiklerine yetiştirilmesi, Apple iç geliştirme kültüründe acil dönüşüm sinyali. 🔗 | KAT-7 | Times of India | 🔴 |
| 4 | Anthropic-Pentagon gerilimi West Wing düzeyine çıktı — Axios’a göre Dario Amodei, Claude “Mythos” etrafındaki hükümet erişimi/siber güvenlik anlaşmazlığını çözmek için Beyaz Saray görüşmesine gidiyor. 🔗 | KAT-1 | Axios | 🔴 |
| 5 | DR³-Eval deep research agent eval boşluğunu hedefliyor — multimodal, multi-file rapor üretimi için static web sandbox + citation/factuality/depth metrikleri öneriyor; Oracle NRE için doğrudan uygulanabilir. 🔗 | KAT-3 | HF/arXiv 2604.14683 | 🔴 |
| 6 | HY-World 2.0 açık kaynak 3D world model çıtasını yükseltti — text/image/video girdiden gezilebilir 3D Gaussian Splatting dünya üretimi; embodiment ve simülasyon veri üretimi için güçlü sinyal. 🔗 | KAT-3/KAT-8 | HF/arXiv 2604.14268 | 🟡 |
| 7 | HiVLA, robot manipulation’da planner/action ayrımını güçlendirdi — VLM planner + diffusion transformer action expert ile uzun-horizon ve cluttered scene manipülasyonuna yeni mimari öneriyor. 🔗 | KAT-8 | HF/arXiv 2604.14125 | 🟡 |
Dedupe notu: Elenenler: Gemini 3.1 Flash TTS, Gemini Robotics-ER 1.6, Mistral 3, MCP supply-chain alarmı, Chrome 147 stable, VS 2026/UiPath/Apple eski platform maddeleri, Context Over Content, RLVR reward hacking, IE as Cache, Abstract Sim2Real, Touch Dreaming, CLAW/arXiv 2604.11251.
🤖 KAT-1 · AI Laboratuvarları & Model Haberleri
- OpenAI: Üç üst düzey yönetici ayrılığı raporlandı; şirketin science/Sora/B2B uygulama hatlarında yeniden odaklandığı yorumlanıyor. Kaynak: Business Insider
- Anthropic: Dario Amodei’nin White House görüşmesi, Claude/Mythos siber kapasitesi ve hükümet erişimi tartışmasını model politikasından ulusal güvenlik katmanına taşıyor. Kaynak: Axios
- Anthropic / Claude Opus 4.7 yüzeyi: Simon Willison,
llm-anthropic 0.25içindeclaude-opus-4.7model desteğini ve Opus 4.6→4.7 system prompt farklarını notladı. Kaynak: Simon Willison - Meta: Muse Spark duyurusu geçen hafta raporlandı; 72 saat delta olmadığı için Top 7’ye alınmadı. Kaynak: Business Insider
🕸️ KAT-2 · Agent & Framework
- World ID for Agents: World ID 4.0, “agent’in arkasındaki insanı doğrulama” fikrini enterprise/consumer entegrasyonuna taşıyor. Agentic commerce ve outbound automation için kimlik primitive’i olabilir. Kaynak: Computerworld, World
- Claude Code tasarım alanı:
Dive into Claude Codemakalesi, permission modes, compaction pipeline, MCP/plugins/skills/hooks ve subagent delegation gibi mimari kararları kaynak kod üzerinden analiz ediyor. Kaynak: HF/arXiv 2604.14228 - MCP governance: MCP maintainer ekibi genişledi; bu delta eski ama protokolün Linux Foundation/AAIF sonrası kurumsallaşmasının sürdüğünü gösteriyor. Kaynak: MCP Blog
- Dedupe: MCP supply-chain/RCE alarmı bu raporda tekrar öne çıkarılmadı; 72 saat listesinde daha önce vardı.
📄 KAT-3 · Makaleler & Araştırma
| arXiv ID | Başlık | Neden Önemli | Kaynak |
|---|---|---|---|
| 2604.14683 | DR³-Eval: Towards Realistic and Reproducible Deep Research Evaluation | Deep research agent’ları citation coverage, factual accuracy ve depth quality ile ölçüyor. | HF |
| 2604.14268 | HY-World 2.0 | Açık kaynak multimodal 3D world model; simülasyon/embodied veri üretimi için kritik. | HF |
| 2604.15308 | RAD-2 | Autonomous driving motion planning için diffusion generator + RL discriminator mimarisi. | HF |
| 2604.14125 | HiVLA | VLM semantic planner ile low-level robot control’ü ayrıştırıyor. | HF |
| 2604.14922 | LongAct | Long-context RL’de saliency-guided sparse update ile LongBench v2/RULER kazanımı bildiriyor. | HF |
| 2604.13226 | KV Packet | RAG/long-context inference için recomputation-free KV cache reuse öneriyor. | HF |
| 2604.14531 | TRACER | Production trace’lerden surrogate router eğitip LLM classification maliyetini düşürüyor. | HF |
Oracle için çıkarım: NRE hattına DR³-Eval tarzı citation coverage + factual accuracy + instruction following + depth quality gate’i eklenmeli. TRACER, basit sınıflandırma/routing işlerinde pahalı model çağrılarını surrogate ile azaltmak için direkt aday.
🧠 KAT-4 · Düşünce Liderleri
| Kişi | Görüş Özeti | Tarih | Kaynak |
|---|---|---|---|
| Simon Willison | Claude Opus 4.6→4.7 system prompt farklarını ve Claude prompt arşivinin git timeline olarak incelenmesini anlattı. | 18 Nisan | simonwillison.net |
| Sam Altman / World | AI çağında insan/agent ayrımı için World ID 4.0 vizyonunu “proof of human” olarak konumlandırdı. | 17-19 Nisan | TechCrunch |
| Gary Marcus | Claude Code’u “LLM’den sonraki en büyük AI ilerlemesi” olarak yorumladı; eski ama hâlâ tartışma taşıyor. | 11 Nisan | diff.blog |
| Karpathy / LeCun / Andrew Ng / swyx | Son 48 saate ait güvenilir, doğrudan yeni görüş bildirimi doğrulanamadı. | — | ⚠️ Web index yetersiz |
🔴 KAT-5 · Reddit Viral
| Subreddit | Başlık | Upvote | Kaynak |
|---|---|---|---|
| r/ClaudeAI | AMD AI Director’s Analysis Confirms Lobotomization of Claude | 2179 | AI Signal digest |
| r/ClaudeCode | Claude Code (~100 hours) vs. Codex (~20 hours) | 1319 | AI Signal digest |
| r/LocalLLaMA | the state of LocalLLaMA | 1705 |
⚠️ KAT-5 Eşik Notu: Son 24 saatte 500+ upvote doğrulanmış yeni AI thread bulunamadı. Yukarıdaki maddeler stale sinyal olarak tutuldu, Top 7’ye alınmadı.
🐦 KAT-6 · Twitter/X Viral
| Hesap | Tweet Özeti | Etki | Tarih |
|---|---|---|---|
| @gregkamradt / ARC-AGI çevresi | ARC-AGI-3’ün frontier modelleri <1% seviyesinde bırakması tartışıldı. | Viral teknik tartışma, metrik doğrulanamadı | 25 Mar civarı |
| @simonw | AI-powered security research tag’i açtı; siber güvenlikte LLM kullanımını izliyor. | High-signal takip listesi | 4 Apr index |
| @garrytan | MCP’nin doğru yapıldığında “magic” olabileceğini söyledi. | Agent/MCP sentiment | 4 Apr index |
| @levelsio | GPT-Image-2 leak iddiası / Arena kod adları tartışıldı. | Viral iddia, resmi doğrulama yok | 4 Apr index |
⚠️ KAT-6 Kaynak Hatası: Canlı X/CDP metrikleri erişilebilir değildi; web index yalnızca eski TechTwitter sayfası verdi. Kaynak: TechTwitter trending
🌐 KAT-7 · Platform & Ekosistem
- Apple Developer April 2026: App Store Connect Analytics 100+ yeni metrik, peer benchmarks, Swift concurrency oturumu ve yeni Metal/ML dokümanları yayımlandı. Kaynak: Apple Developer
- Apple Siri AI bootcamp: Siri ekibinin WWDC26 öncesi AI coding bootcamp’e alınması, Apple’ın AI-assisted engineering açığını kapatma hamlesi. Kaynak: Times of India
- Chrome 147:
element.startViewTransition(), CSScontrast-color(), Device Memory API limit güncellemesi ve Local Network Access kısıtları var. Top 7’ye alınmadı çünkü Chrome 147 daha önce raporlanmıştı. Kaynak: Chrome Developers - VS Code: 1.116 son sürüm 15 Nisan olarak görünüyor; 1.114 hattında weekly Stable cadence, TypeScript 6.0 ve Claude agent policy notları öne çıkmış. Kaynak: VersionRelease, Visual Studio Magazine
🦾 KAT-8 · Robotik & Edge AI
- HiVLA: Robot manipulation için semantic planning ve action execution ayrımı; gerçek dünya/sim başarıları bildiriliyor. Kaynak: HF/arXiv 2604.14125
- RAD-2: Otonom sürüşte closed-loop planning için diffusion generator + RL discriminator; çarpışma oranında ciddi düşüş iddiası var. Kaynak: HF/arXiv 2604.15308
- HY-World 2.0: Text/single image/video girdiden navigable 3D world; robot simülasyon ve world-model pipeline’ları için veri motoru olabilir. Kaynak: HF/arXiv 2604.14268
- Serve Robotics “Maggie”: T-Mobile edge network ile konuşan delivery robot demosu GTC 2026’da gösterildi; eski tarihli ama edge robotics sinyali. Kaynak: Serve Robotics
⭐ KAT-9 · OSS & Ürün Sinyalleri
HN Öne Çıkanlar
| Puan | Başlık | Kaynak |
|---|---|---|
| 43 | The Bromine Chokepoint: How Strife Could Halt Production of World’s Memory Chips | HN |
⚠️ HN Notu: Bu geçişte 100+ puanlı AI/OSS Show HN maddesi doğrulanamadı.
GitHub Trending
| Repo | Stars/Gün | Alan |
|---|---|---|
| NousResearch/hermes-agent | 6k+ / stale index | Long-lived agent infra |
| microsoft/markitdown | sayı doğrulanmadı | Document-to-Markdown / RAG plumbing |
| Archon harness builder | sayı doğrulanmadı | Deterministic agent harness |
⚠️ GitHub Trending Notu: GitHub daily sayfaları açıldı ancak repo satırları parse edilemedi; yukarıdaki sinyaller agents-radar stale index’inden. Kaynak: agents-radar Apr 12, GitHub Python Trending, GitHub TypeScript Trending
Product Hunt AI
- Brila, Velo, NovaVoice, Fathom 3.0, Figma for Agents, Google Gemma 4, Claude Code Desktop App Redesigned Nisan 2026 AI ürün listesinde üst sıralarda. Kaynak: Hunted.Space Product Hunt AI
🇹🇷 Türk Tech Sahnesi
- Webrazzi AI 2026: Türkiye iş dünyası ve girişimcilik ekosistemi için 40+ konuşmacı ve 1000+ katılımcı ile yapay zeka odaklı büyük etkinlik raporlandı. 72 saat içinde değil, ama Türkiye sinyali olarak değerli. Kaynak: Ekonomim, Güneş
- Technopat: Son taramada yeni 72 saatlik AI gelişmesi bulunmadı; en yakın ilgili içerikler CES/AI PC ve genel AI öngörüleri. Kaynak: Technopat AMD/CES 2026
🧠 Oracle Self-Improvement Sinyalleri
| # | Bulgu | Kaynak | Uygulama Alanı | Efor |
|---|---|---|---|---|
| 1 | Deep research raporlarında citation coverage + factuality + depth ayrı ayrı skorlanmalı. | DR³-Eval | NRE verification gate | Orta |
| 2 | Trace-based surrogate routing, basit classification/routing görevlerinde pahalı model çağrısını azaltabilir. | TRACER | model router / cron triage | Orta |
| 3 | KV cache reuse fikri, tekrar eden uzun context dosyalarında latency/cost azaltma stratejisi olabilir. | KV Packet | context-buffer / memory retrieval | Büyük |
| 4 | Agent action’larında “insan arkasında mı?” doğrulaması yakında ürün primitive’i olacak. | World ID 4.0 | governance / outbound action policy | Orta |
🐦 CikCik Paketi (@muxamos sesi)
Tweetler (3–5 adet)
Tweet 1 (Konu: World ID 4.0):
AI agent çağında asıl eksik model değil, kimlik katmanı olabilir. “Bu action’ın arkasında gerçek insan var mı?” sorusu yakında API tasarımının parçası olacak.
Tweet 2 (Konu: DR³-Eval):
Deep research raporu artık “güzel özet” diye geçmemeli. Citation coverage, factual accuracy, instruction following ve depth quality ayrı ayrı ölçülmeli. Yoksa araştırma değil, süslü hallucination.
Tweet 3 (Konu: Apple Siri bootcamp):
Apple’ın Siri ekibini AI coding bootcamp’e alması küçük haber değil. Artık şirketlerin AI açığı sadece ürün tarafında değil, içeride yazılım üretme hızında da ölçülüyor.
Tweet 4 (Konu: HY-World 2.0):
Text/image/video’dan gezilebilir 3D dünya üretimi robotik için sleeper gelişme. Robotu gerçek dünyada eğitmek pahalı; iyi simülasyon datası yeni compute moat’i olabilir.
Reply Fırsatları (2–3)
@simonw altına (Claude prompt diff):
System prompt diff’lerini git timeline’a çevirmek çok iyi fikir. Model davranışını “release note” gibi değil, değişen operational policy gibi okumak gerekiyor.
@garrytan altına (MCP):
MCP magic olabilir ama magic kısmı tool discovery değil, permission + audit + rollback disiplini. Yoksa aynı protokol çok hızlı şekilde supply-chain yüzeyi oluyor.
Günün Hook'u
Agent çağının yeni sorusu: “Bunu AI mı yaptı?” değil, “Bu action’ın sorumlusu kim?”
📊 Kaynak & Durum Özeti
| Kategori | Kaynak | Durum | Madde |
|---|---|---|---|
| KAT-1 | BI, Axios, Simon Willison, Meta/BI | ✅ | 4 |
| KAT-2 | World, Computerworld, MCP Blog, HF/arXiv | ✅ | 4 |
| KAT-3 | Hugging Face Daily Papers | ✅ | 7 |
| KAT-4 | Simon, TechCrunch, diff.blog | ✅/⚠️ | 4 |
| KAT-5 | Reddit + AI Signal digest | ⚠️ | 3 |
| KAT-6 | TechTwitter web index | ⚠️ | 4 |
| KAT-7 | Apple Developer, Chrome Dev, VS Code, Times | ✅ | 4 |
| KAT-8 | HF/arXiv, Serve Robotics | ✅ | 4 |
| KAT-9 | HN, GitHub Trending, agents-radar, Product Hunt proxy | ⚠️ | 5 |
Toplam dedupe elenen: 12 madde | Yeni madde: 24 | Sonraki temizlik: 2026-04-20 04:00 İST
Rapor: Gece Araştırma v2 · 2026-04-20 01:00 İST · Oracle 🦉