我們是 Voiss AI, 一間專注於地端模型的AI語音、RAG及Agent Flow 邊緣運算應用的新創團 隊,我們工作節奏快速,要能快速理解客戶需求,歡迎喜歡挑戰的人、有熱情的人,成爲頂尖人才,這裡是邁向國際的舞台! 需要的核心技術 ●生成式AI地端部署:不只是用OpenAI API,更要會Llama等開源LLM的本地化調校、壓 縮、量化(quantization)、多卡部署,讓模型在受限GPU、Jetson Orin、ARM等不同硬體環境跑得動。 ●量化與模型壓縮經驗:實際將大型LLM/語音模型做過 int8/float16 量化,或用過如 bitsandbytes、GGML、Transformer Lite、Distillation 等壓縮/加速框架。 ●Chunking與文本前處理:在文件分塊上有過特殊實作經驗,例如:利用 NER(Named Entity Recognition)、自訂關鍵字斷點、向量特徵拆分等方式,讓RAG檢索更精準,或 曾為超長文檔處理過大規模切分優化。 ●支援多格式文件自動上傳與前處理,包含 PDF、Word、純文字(txt)、圖片、常 見表格格式等。 ●針對image-based PDF與圖片文件,採用 tesseract OCR 進行文字辨識。 chunking 支援 自定義字數/段落切分(max chunk size、overlap 可調),適應各種語料規模與檢索需求。 ●語音模型高度自訂:如有在 CloneTTS 上的語音「口氣、語速、腔調、頻率、分貝」細緻調控,或熟悉台灣本地語音數據調教與TTS模型細節,能針對客戶需求做出“真人感”強 的仿聲結果。 ●ASR音訊處理:熟悉音訊前處理(VAD、降噪、增強)、特徵萃取、聲學模型參數微調,或有自己實作語音分割、低延遲處理經驗,能針對「收音條件差、雜訊多」的場合優化模型辨識效果。 需要的系統開發整合經驗 ●Docker映像包/自動化佈署:能將複雜AI模型與環境依賴全部封裝並自動化,熟悉K8s 批量佈署、GPU任務排程與效能監控。 向量資料庫整合:用過 FAISS、Milvus、Chroma、pgvector 等,熟悉資料向量化流程、 召回與重排序調校、不同資料源混合檢索策略。 ●微服務、RESTful API設計與串接:設計過大型分散式系統,能將AI服務與其他企業資 訊系統(ERP/CRM/APP)順暢串接。
年薪960,000~1,000,000元
(固定或變動薪資因個人資歷或績效而異)請將個人作品集、Demo影片、GitHub連結等寄到 info@voiss.cc 信件主旨註明:「申請Voiss AI 地端工程師_姓名」