AI & Open Source Daily — 30 Juni 2026
Xiaomi masuk arena AI coding agent dengan 11K stars, DeepSeek rilis pipeline speculative decoding, Adam CADAM bikin text-to-CAD open source di browser, plus Workweave Router dan vLLM Semantic Router.
Hari ini panas banget di dunia AI & open source. Xiaomi — perusahaan hardware consumer yang lo kenal bikin HP — tiba-tiba masuk arena AI coding agent dengan produk yang udah dapet 11.108 stars dalam 20 hari. DeepSeek juga gak mau kalah, rilis full pipeline training speculative decoding buat siapa aja yang mau latih draft model sendiri. Plus ada Adam CADAM dari YC W25 yang bikin text-to-CAD open source langsung di browser.
Xiaomi MiMo Code — AI Coding Agent dengan Persistent Memory SQLite
Dari XiaomiMiMo/MiMo-Code — terminal-native AI coding assistant yang open source di bawah MIT license. Repo ini dibuat 10 Juni 2026 dan udah dapet 11.108 stars dalam 20 hari. Ini angka yang gila untuk repo baru.
Apa yang bikin MiMo beda? Persistent memory. Kebanyakan coding agent — termasuk Claude Code dan Codex — ilang context begitu session ditutup. Besoknya lo harus jelasin ulang project lo dari nol. MiMo pakai SQLite FTS5 buat nyimpen project memory (MEMORY.md), session checkpoint (checkpoint.md), scratch notes (notes.md), dan per-task progress logs. Jadi agent ini inget apa yang lo kerjain kemarin.
Arsitekturnya modular: ada 3 mode agent — build (full permissions), plan (read-only analysis), compose (specs-driven orchestration). Yang menarik: compose mode punya built-in skills untuk planning, execution, code review, TDD, debugging, verification, merging. Kayak punya senior dev 24/7 yang gak pernah tidur. Plus ada voice input real-time pakai TenVAD + MiMo ASR.
Install-nya satu baris:
Kenapa ini penting? Karena Xiaomi — perusahaan hardware consumer — masuk arena yang selama ini didominasi Anthropic, OpenAI, dan startup independen. Dengan MIT license dan support any OpenAI-compatible API, MiMo Code gak lock-in lo ke satu vendor. Plus ada fitur import config dari Claude Code dalam satu langkah — barrier untuk switch rendah banget.
Status: Rilis — open source. Bisa langsung dicoba.
DeepSeek DeepSpec — Full Pipeline Training Speculative Decoding
Dari deepseek-ai/DeepSpec — repo yang baru 4 hari (26 Juni 2026) dan udah dapet 4.489 stars. Ini full-stack codebase buat training dan evaluasi draft model untuk speculative decoding.
Buat yang belum familiar: speculative decoding adalah teknik mempercepat LLM inference tanpa ngubah output quality. Caranya: draft model (kecil, cepat) predict token, target model (besar, lambat) verify. Kalau cocok — hemat 2-3x waktu. Kalau gak — target model regenerate. DeepSpec bikin pipeline ini bisa di-training siapa aja.
Pipeline-nya 3 stage: Data Preparation (download prompts + regenerate answers + build target cache, bisa sampe 38TB untuk default config), Training (train.sh launch train.py, satu worker per GPU, pilih algoritma via config), dan Evaluation (eval.py terhadap trained checkpoint di benchmark GSM8K, MATH500, AIME25, HumanEval, MBPP, LiveCodeBench, MT-Bench, Alpaca, Arena-Hard-v2).
DeepSeek juga rilis trained checkpoints untuk 3 algoritma (DSpark, DFlash, Eagle3) across 4 target models: Qwen3-4B, Qwen3-8B, Qwen3-14B, dan Gemma-4-12B-it. Semua bisa langsung dipakai dari HuggingFace. Ini game changer buat production inference optimization — lo bisa train draft model custom untuk model target lo sendiri.
Bedanya dari vLLM speculative decoding: vLLM fokus di serving-side (menerapkan speculative decoding saat inference), DeepSpec fokus di training side (membuat draft model yang optimal). Keduanya komplementer.
Status: Rilis — open source di bawah MIT license.
Adam CADAM — Text-to-CAD Open Source di Browser
Dari Adam-CAD/CADAM — YC W25 startup yang bikin text-to-CAD web app open source. 4.677 stars, 215 HN points. Lo ketik deskripsi pakai natural language, CADAM generate 3D model dengan parametric controls langsung di browser.
Stack-nya impressive: React 19.1 frontend, Supabase backend, OpenSCAD dikompilasi ke WebAssembly buat rendering CAD di browser, Three.js buat real-time preview. AI generation ubah text/image prompt jadi parametric OpenSCAD code, yang kemudian di-render in-browser. Parameter extraction otomatis identify adjustable dimensions, dan smart updates allow perubahan parameter tanpa AI re-generation.
Benchmark-nya gila: dari V8 engine complete dengan 22 dimensions dan 8 colors, sampai 9-cylinder radial aircraft engine — semua dari satu prompt plain-language. Ini bukan cuma tech demo. Support export .STL, .SCAD, .DXF — siap buat 3D printing.
Yang bikin beda dari commercial tools: CADAM fully open source (GPL-3.0), browser-based (gak perlu install CAD lokal), dan punya parametric controls — bukan cuma generate static model. Lo bisa adjust dimensions pakai interactive sliders. Dan karena output-nya OpenSCAD code, hasilnya editable dan precise — bukan mesh blob.
Status: Rilis — live demo di adam.new/cadam, bisa self-host.
Workweave Router — Route Prompt ke Model Terbaik, Auto
Dari workweave/router — drop-in proxy untuk Anthropic, OpenAI, dan Gemini API yang otomatis pilih model terbaik untuk setiap request. 613 stars, 212 HN points. Dibangun dengan Go, route tiap prompt dalam <50ms.
Cara kerjanya simpel: point Claude Code, Codex, Cursor, atau app apapun ke localhost:8080. Router intercept request, jalankan cluster scorer berbasis Avengers-Pro (arXiv:2508.12631) buat scoring model yang enabled. Request ringan ke model murah, request berat ke frontier model. Claim cut cost 40-70%.
Support Anthropic Messages API, OpenAI Chat Completions, Gemini native — termasuk streaming, tools, vision. Plus tau model open source juga: DeepSeek, Kimi, GLM, Qwen, Llama, Mistral lewat OpenRouter atau OpenAI-compatible endpoint. Self-hosted mode: Docker + Postgres + router on port 8080, dashboard on port 8080/ui.
Ini bukan cuma convenience — ini cost optimization yang measurable. Di dunia multi-model kayak sekarang, routing jadi critical infrastructure. Lo gak mau kirim "fix typo" ke Claude Opus yang charge $15/MTok.
Status: Rilis — hosted dan self-hosted. License ELv2 (source available, bukan OSI open source).
vLLM Semantic Router — Micro-Agent Collaboration di Serving Layer
Dari tim vLLM — konsep baru yang membawa micro-agent collaboration ke API serving layer. Ada 5 "looper" patterns: Confidence (sequential escalation, coba model murah dulu), Ratings (parallel candidates dengan rating-aware aggregate), ReMoM (fan-out breadth samples + quorum + synthesis), Fusion (panel-judge-finalizer), dan Workflows (bounded role system). User cukup panggil model "vllm-sr/auto" — semua complexity di belakang.
Yang paling impressive: benchmark results. VSR Closed score LiveCodeBench 92.6 (beat Fugu Ultra 92.0, GPT-5.5 90.7), GPQA-Diamond 96.0 (beat Gemini 3.1 Pro 94.3, GPT-5.5 93.6). Router-owned collaboration bisa beat single frontier model dengan satu API surface yang sama. Ini bukan cuma paper — ini implementation di vLLM.
Bedanya dari LangChain/LangGraph: di VSR, collaboration hidup di serving infrastructure (router), bukan di application code. Lo gak perlu bikin agent orchestration di Python — cukup satu API call. Bedanya dari Workweave Router: Workweave fokus di model selection per-request, VSR fokus di collaboration patterns (fan-out, quorum, synthesis).
Status: Beta — article dipublikasi 29 Juni 2026 di vllm.ai/blog.
