本文,我们将使用推理终端的
自定义回调函数 来解决这一挑战,将其它把自动语音识别 (ASR) 、说话人分割流水线以及投机解码串联起来并嵌入推理端点。这一设计主要受
Insanely Fast Whisper 的启发,其使用了
Pyannote 说话人分割模型。