🏆 KV Cache Arena
WikiText-2 测试集 · 20 chunks × 400 tokens · GPT-2 (124M) · Budget 固定: 32 / 64 / 128 tokens
基线 PPL(Budget=32)
47.39
基线 PPL(Budget=64)
47.39
基线 PPL(Budget=128)
47.39
评估队列
—
📤 提交策略
学号
格式:U + 9 位数字 · 每学号每 6 小时限提交 1 次
策略名称
显示在排行榜上的名称
评估 Budget(固定,不可修改)
32 tokens
64 tokens
128 tokens
三个 budget 全部评估,chunk 长度固定 400 tokens
compress 函数代码
def compress(past_key_values, max_budget: int, step: int): """ 在这里实现你的 KV cache 压缩策略。 参数: past_key_values : 当前 KV cache(transformers DynamicCache) max_budget : 最多保留多少个 token step : 当前是第几个 token(0-indexed) 返回: 压缩后的 past_key_values 可用工具: kv_utils.keep_recent(pkv, n) kv_utils.select_indices(pkv, indices) # indices: LongTensor kv_utils.get_seq_len(pkv) kv_utils.get_device(pkv) 允许 import: torch, kv_utils, math, random """ # TODO: 在这里实现你的策略 return past_key_values
只允许 import torch / kv_utils / math / random,禁止 exec / eval / open 等。
🚀 提交评估
📊 排行榜(每学号取最优提交)
—
↻ 刷新
暂无数据,快来第一个提交!