Runpod ar selfgen nextsteps by windy-schmieder · Pull Request #1419 · openai/parameter-golf

windy-schmieder · 2026-04-06T16:14:35Z

No description provided.

Adds Full Attention Residuals (AttnRes) from Kimi Team paper to the LeakyReLU² + Legal TTT + Parallel Muon stack. Zero-initialized learned softmax depth-attention over all preceding layer outputs replaces fixed x0 global residual. Also updates train_gpt_mlx.py with the same changes for local Apple Silicon testing. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>

… lzma-9 Builds on 2026-03-24 AttnRes stack. Five improvements: - MTP_NUM_HEADS=1: free training signal, stripped at export (0 artifact bytes) - GATED_ATTENTION=1: per-head sigmoid gate, ~24KB cost - VALUE_RESIDUAL=1: value-stream skip connection, ~0 bytes - TTT Adam optimizer: replaces SGD for better per-chunk adaptation (lr=2e-4) - lzma preset=9: improved artifact compression, no eval time cost Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>

- Base: LeakyReLU² + Legal TTT + Parallel Muon (1.1194) - MTP_NUM_HEADS=1: free training signal, stripped at export - GATED_ATTENTION=1: per-head sigmoid gate, ~24KB artifact cost - VALUE_RESIDUAL=1: value-stream skip, vr_lambda init [0.0, 1.0] - lzma preset=9: better compression, no eval cost - TTT_USE_ADAM added but off by default (SGD preserved from SOTA) Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>

windy-schmieder and others added 6 commits March 25, 2026 00:24

Merge branch 'main' of https://github.com/openai/parameter-golf

4293dcd

Merge remote-tracking branch 'origin/main'

a31f568

Add 2026-04-06 AR self-gen GPTQ next-step ablation folder

e29aa1f

windy-schmieder closed this Apr 6, 2026

windy-schmieder deleted the runpod-ar-selfgen-nextsteps branch April 6, 2026 16:14

This was referenced Apr 23, 2026

Record: SP4096 + byte-level PPM adaptive-λ mixture — val_bpb 1.01925 (3-seed) #1785

Closed

Record: SP4096 + byte-level PPM adaptive-λ mixture (strict-legal gate) — val_bpb 1.01252 (3-seed) #1795

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Runpod ar selfgen nextsteps#1419

Runpod ar selfgen nextsteps#1419
windy-schmieder wants to merge 6 commits intoopenai:mainfrom
windy-schmieder:runpod-ar-selfgen-nextsteps

windy-schmieder commented Apr 6, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

windy-schmieder commented Apr 6, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant