72 小时上线成人自考口语评测 API：基于 GPT-OSS 的快速实现

最近折腾了一个项目：3 天内完成自考口语评测 API 的开发与上线。这里快速记录下关键流程，方便有类似需求的朋友。

1. 技术目标

字错率 < 5%
延迟 < 800ms
命中率 ≈ 96%（接近人工考官）

2. 数据准备

准备了 1000 条口语录音 + 标注，做了预处理：

去噪、裁剪
划分训练 / 验证集

3. 模型微调

基于 GPT-OSS 开源权重，使用 LoRA + Adapter 微调。

from peft import LoraConfig, get_peft_model

config = LoraConfig(
    r=8, lora_alpha=32,
    target_modules=["q_proj", "v_proj"],
    lora_dropout=0.1, bias="none"
)
model = get_peft_model(base_model, config)

4. 部署

使用 FastAPI + uvicorn，通过异步调用和多 worker 解决并发延迟问题。

from fastapi import FastAPI
app = FastAPI()

@app.post("/evaluate")
async def evaluate(audio: bytes):
    # 调用模型推理
    return {"score": 95, "feedback": "发音流畅"}

压测结果：600–700ms 延迟 / 1k 并发稳定。