最近折腾了一个项目:3 天内完成自考口语评测 API 的开发与上线。这里快速记录下关键流程,方便有类似需求的朋友。
1. 技术目标
- 字错率 < 5%
- 延迟 < 800ms
- 命中率 ≈ 96%(接近人工考官)
2. 数据准备
准备了 1000 条口语录音 + 标注,做了预处理:
- 去噪、裁剪
- 划分训练 / 验证集
3. 模型微调
基于 GPT-OSS 开源权重,使用 LoRA + Adapter 微调。
from peft import LoraConfig, get_peft_model
config = LoraConfig(
r=8, lora_alpha=32,
target_modules=["q_proj", "v_proj"],
lora_dropout=0.1, bias="none"
)
model = get_peft_model(base_model, config)
4. 部署
使用 FastAPI + uvicorn,通过异步调用和多 worker 解决并发延迟问题。
from fastapi import FastAPI
app = FastAPI()
@app.post("/evaluate")
async def evaluate(audio: bytes):
# 调用模型推理
return {"score": 95, "feedback": "发音流畅"}
压测结果:600–700ms 延迟 / 1k 并发稳定。
5. 成果
- 72 小时完成上线
- 开源方案 → 成本几乎为 0
- 实测效果可满足自考口语评分场景
👉 完整代码和部署脚本已放在官网文章中,点这里查看