Hugging Face 热门模型日报 2026-04-06
数据来源: Hugging Face Hub | 共 30 个模型 | 生成时间: 2026-04-06 00:11 UTC
Hugging Face 热门模型日报 | 2026-04-06
今日速览
本周 Hugging Face 生态呈现多模态主导态势,Google Gemma-4 系列全面铺开,从 26B 到 31B 参数覆盖多档配置,原生支持图像-文本理解与 any-to-any 架构。社区微调势力崛起,Jackrong 基于 Qwen3.5 的 Claude 推理蒸馏模型以 2,345 点赞登顶,HauhauCS 的"去审查"系列下载量突破 140 万。量化部署成为标配,unsloth 与社区 GGUF 版本占据榜单近三分之一席位,1-bit 极端压缩技术(Bonsai-8B)引发边缘部署新想象。
热门模型
🧠 语言模型(LLM、对话模型、指令微调)
🎨 多模态与生成(图像、视频、音频、文本到X)
🔧 专用模型(代码、数学、医疗、嵌入)
📦 微调与量化(社区微调、GGUF、AWQ)
| 模型 |
作者 |
点赞 |
下载 |
一句话说明 |
| prism-ml/Bonsai-8B-gguf |
prism-ml |
426 |
38,631 |
1-bit 极端量化实验,8B 模型压缩至前所未有的体积,llama.cpp 边缘部署的极限探索 |
| Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-v2-GGUF |
Jackrong |
509 |
254,428 |
v2 迭代版 GGUF,推理蒸馏模型的高性能本地部署方案 |
| unsloth/gemma-4-26B-A4B-it-GGUF |
unsloth |
245 |
487,384 |
Unsloth 官方 Gemma-4 MoE 量化版,下载量逼近 50 万,社区最活跃的多模态本地运行方案 |
| dealignai/Gemma-4-31B-JANG_4M-CRACK |
dealignai |
201 |
3,123 |
"ABLITERATED"(能力抹除)微调版,MLX 框架 Apple Silicon 优化,去审查与对齐绕过 |
| nvidia/Gemma-4-31B-IT-NVFP4 |
nvidia |
195 |
85,892 |
NVIDIA ModelOpt 官方优化版,NVFP4 精度格式,Hopper/Blackwell GPU 推理加速 |
| Jackrong/Qwopus3.5-9B-v3-GGUF |
Jackrong |
187 |
43,478 |
Jackrong 系列轻量化版本,9B 参数本地友好,"Qwopus"暗示章鱼式多能力融合 |
| unsloth/gemma-4-31B-it-GGUF |
unsloth |
179 |
408,920 |
Unsloth 旗舰 31B 密集版量化,40 万+下载验证其社区基础设施地位 |
| Jackrong/Qwopus3.5-27B-v3-GGUF |
Jackrong |
171 |
37,479 |
27B 推理增强版 GGUF,标签含"reasoning",专攻逻辑与数学场景 |
| prism-ml/Bonsai-8B-mlx-1bit |
prism-ml |
147 |
20,522 |
Bonsai 的 Apple Silicon 特供版,MLX 框架 1-bit 推理,Mac 本地极限压缩 |
| unsloth/gemma-4-E4B-it-GGUF |
unsloth |
140 |
317,317 |
any-to-any 架构的 GGUF 版本,多模态本地部署的前沿尝试,31 万下载预示强烈需求 |
生态信号
Gemma-4 全面接管开源多模态。 Google 以 7 个模型条目构建完整矩阵:密集版(31B/26B)、MoE 版(A4B/A3B)、any-to-any 实验版(E4B/E2B),覆盖从云端到边缘的全场景。Apache 2.0 协议与官方/社区量化协同,形成对 Llama、Qwen 的合围之势。
Qwen3.5 成为社区创新基座。 阿里通义千问未直接上榜,但 Jackrong、HauhauCS、Hcompany 等开发者以其为骨架,通过蒸馏(Claude 推理)、去审查(Uncensored)、MoE 扩展(35B-A3B)构建衍生生态,反映 Qwen 架构的开放性与可塑性。
量化即基础设施。 30 个模型中 11 个含 GGUF/MLX/NVFP4 标签,unsloth 以 4 个模型、超 170 万总下载量确立"开源模型部署层"地位。1-bit 极端压缩(Bonsai-8B)与 NVIDIA 专有格式(NVFP4)并行,显示压缩技术路线的分化。
"去审查"成为显式需求。 HauhauCS 两个模型合计 141 万下载,标签直书"uncensored""aggressive",社区对对齐限制的反弹形成可观市场。与之呼应,dealignai 的"ABLITERATED"微调同样瞄准此需求。
值得探索
本日报由 agents-radar 自动生成。
Hugging Face 热门模型日报 2026-04-06
Hugging Face 热门模型日报 | 2026-04-06
今日速览
本周 Hugging Face 生态呈现多模态主导态势,Google Gemma-4 系列全面铺开,从 26B 到 31B 参数覆盖多档配置,原生支持图像-文本理解与 any-to-any 架构。社区微调势力崛起,Jackrong 基于 Qwen3.5 的 Claude 推理蒸馏模型以 2,345 点赞登顶,HauhauCS 的"去审查"系列下载量突破 140 万。量化部署成为标配,unsloth 与社区 GGUF 版本占据榜单近三分之一席位,1-bit 极端压缩技术(Bonsai-8B)引发边缘部署新想象。
热门模型
🧠 语言模型(LLM、对话模型、指令微调)
🎨 多模态与生成(图像、视频、音频、文本到X)
🔧 专用模型(代码、数学、医疗、嵌入)
📦 微调与量化(社区微调、GGUF、AWQ)
生态信号
Gemma-4 全面接管开源多模态。 Google 以 7 个模型条目构建完整矩阵:密集版(31B/26B)、MoE 版(A4B/A3B)、any-to-any 实验版(E4B/E2B),覆盖从云端到边缘的全场景。Apache 2.0 协议与官方/社区量化协同,形成对 Llama、Qwen 的合围之势。
Qwen3.5 成为社区创新基座。 阿里通义千问未直接上榜,但 Jackrong、HauhauCS、Hcompany 等开发者以其为骨架,通过蒸馏(Claude 推理)、去审查(Uncensored)、MoE 扩展(35B-A3B)构建衍生生态,反映 Qwen 架构的开放性与可塑性。
量化即基础设施。 30 个模型中 11 个含 GGUF/MLX/NVFP4 标签,unsloth 以 4 个模型、超 170 万总下载量确立"开源模型部署层"地位。1-bit 极端压缩(Bonsai-8B)与 NVIDIA 专有格式(NVFP4)并行,显示压缩技术路线的分化。
"去审查"成为显式需求。 HauhauCS 两个模型合计 141 万下载,标签直书"uncensored""aggressive",社区对对齐限制的反弹形成可观市场。与之呼应,dealignai 的"ABLITERATED"微调同样瞄准此需求。
值得探索
本日报由 agents-radar 自动生成。