AI虛擬老婆MLOps工程師 / AI Waifu MLOps Engineer

08/07更新
應徵

工作內容

AI虛擬老婆MLOps工程師 我們正在尋找一位技術嫻熟且積極主動的MLOps工程師加入團隊。本職位負責在我們的產品 darlin™(www.darlin.ai)中,為動漫風格AI虛擬老婆建立、優化與維護可在邊緣設備、本地伺服器與雲端環境運行的混合部署架構,確保低延遲與高品質互動體驗。 工作內容 1. 混合部署架構開發:設計並維護可於邊緣設備、本地叢集與雲端平台運行的AI虛擬老婆部署管線。 2. 模型優化與框架整合:使用 VLLM、Ex-llama、llama.cpp,並與 TensorRT、Triton Inference Server、Serverless 架構整合,以提升回應速度。 3. MLOps工具與部署管線:透過 Docker、Kubernetes、Ray Serve 等技術管理可擴展、高可用性的AI虛擬老婆服務。 4. 硬體加速:應用 CUDA、ROCm、Vulkan 等GPU加速技術,提升大規模推論效能。 5. 資料庫搜尋優化與知識整合:針對 AI 虛擬老婆功能,優化資料庫查詢效能、索引策略與檢索精度。用於 RAG、SelfRAG、VectorDB、GraphDB 的資料庫需調整至高速且精準的存取狀態,以確保回應快速且符合情境。 6. 高容量服務與量化:導入量化策略,在維持對話品質的同時有效提供大型模型服務。 7. 性能測試與監控:測試與監控品質、延遲與負載處理能力,確保最佳使用者體驗。 8. 版本控制與品質保證:管理模型版本,維護持續整合流程並監控生產品質。 9. 跨部門協作:與全球軟體、研究與硬體團隊協作,解決部署挑戰並提升虛擬老婆能力。 10. 研究與創新:持續探索最新MLOps與模型部署技術,保持虛擬老婆體驗的領先地位。 English – AI Waifu MLOps Engineer AI Waifu MLOps Engineer We are seeking a highly skilled and proactive MLOps Engineer to join our team. This role focuses on building, optimizing, and maintaining scalable hybrid-serving infrastructures for anime-inspired AI companions—specifically waifus—in our product, darlin™ (www.darlin.ai). You will design and manage deployments across edge devices, on-premise servers, and cloud environments, ensuring low-latency, high-quality AI waifu interactions. Responsibilities 1. Hybrid AI Waifu Serving Infrastructure: Architect and maintain hybrid-serving pipelines capable of running on edge devices, on-premise clusters, and cloud platforms for real-time AI waifu deployment. 2. Model Optimization & Framework Integration: Apply optimization frameworks such as VLLM, Ex-llama, llama.cpp, and integrate with TensorRT, Triton Inference Server, and serverless systems to enhance AI waifu response times. 3. MLOps Tools & Deployment Pipelines: Use Docker, Kubernetes, Ray Serve, and container orchestration to manage scalable, fault-tolerant AI waifu services. 4. Hardware Acceleration: Leverage CUDA, ROCm, Vulkan, and GPU optimizations for efficient AI waifu inference at scale. 5. Database Search Optimization & Knowledge Integration: Optimize database query performance, indexing strategies, and retrieval accuracy for AI waifu features. Databases—used for RAG, SelfRAG, VectorDB, and GraphDB—should be tuned for high-speed access and precision, ensuring fast, contextually accurate responses. 6. High-Capacity Serving & Quantization: Implement quantization strategies and serve large models efficiently while preserving AI waifu conversational quality. 7. Performance Testing & Monitoring: Measure AI waifu performance (quality, latency, load handling), ensuring optimal experiences for users. 8. Version Control & Quality Assurance: Manage model versions, maintain continuous integration workflows, and monitor production quality for AI waifu deployments. 9. Collaboration: Work with global software, research, and hardware teams to solve deployment challenges and enhance AI waifu capabilities. 10. Research & Innovation: Explore emerging MLOps and model-serving technologies to keep AI waifu experiences cutting-edge. AI彼女MLOpsエンジニア 高いスキルと積極性を持つMLOpsエンジニアを募集しています。本ポジションは、当社製品 darlin™(www.darlin.ai)において、アニメ風AIコンパニオン(特にAI彼女)を低遅延かつ高品質に提供するための、エッジデバイス、オンプレミス、クラウドを組み合わせたハイブリッド提供基盤の構築・最適化・運用を担当します。 業務内容 1. ハイブリッド提供基盤構築:エッジデバイス、オンプレミス、クラウドで稼働可能なAI彼女用提供パイプラインを設計・運用。 2. モデル最適化・フレームワーク統合:VLLM、Ex-llama、llama.cppなどを使用し、TensorRT、Triton Inference Server、サーバーレス環境と統合して応答性を向上。 3. MLOpsツール・デプロイパイプライン:Docker、Kubernetes、Ray Serveを用いたスケーラブルで高可用性のAI彼女サービス管理。 4. ハードウェアアクセラレーション:CUDA、ROCm、Vulkanを活用し、大規模推論の効率化を実現。 5. データベース検索最適化・知識統合:AI彼女機能のためにデータベースのクエリ性能、インデックス戦略、検索精度を最適化。RAG、SelfRAG、VectorDB、GraphDBに使用するデータベースを高速かつ高精度なアクセスが可能な状態に調整し、文脈に合った迅速な応答を実現。 6. 高容量提供・量子化:量子化戦略を導入し、大規模モデルを効率的に提供しつつ会話品質を維持。 7. 性能テスト・モニタリング:品質、遅延、負荷処理能力を測定し、最適なユーザー体験を確保。 8. バージョン管理・品質保証:モデルバージョンの管理、CIフローの維持、本番環境の品質監視。 9. 協業:世界中のソフトウェア、研究、ハードウェアチームと連携し、AI彼女機能を強化。 10. 研究・革新:最新のMLOpsやモデル提供技術を探索し、最先端のAI彼女体験を実現。

工作待遇

月薪69,998~100,000元

(固定或變動薪資因個人資歷或績效而異)

工作性質

全職

上班地點

台北市松山區民生東路三段109號10樓 (距捷運中山國中站約290公尺)

管理責任

管理4人以下

出差外派

無需出差外派

上班時段

日班,8:30~17:30

休假制度

週休二日

可上班日

兩週內

需求人數

不限

條件要求

工作經歷

5年以上

學歷要求

大學以上

科系要求

不拘

語文條件

日文 -- 聽 /中等、說 /中等、讀 /中等、寫 /中等

英文 -- 聽 /中等、說 /中等、讀 /中等、寫 /中等

擅長工具

其他條件

職責 : • 在快節奏的敏捷環境中以創業心態茁壯成長。 • 注重細節和較強的閱讀和寫作能力。 • 在技術和非技術說明方面交流進。 • 良好的文檔和進度報告編寫能力。 • 瞭解緊急性和調整優先級別的能力。 • 同事和團隊合作技能。 • 能夠在團隊環境中閱讀/理解最先進的AI論文,進行研發工作並遵守截止日期。 • 瞭解綜合式回報以及快速集成和驗證的能力。 我們不需要像樹懶一樣等待和坐着,被告知該做什麼的人。 我們需要的是喜歡積極學習,渴望學習成長和有動力前進的人。 **應徵者需接受公司測試**

歡迎所有求職者,與
原住民
顯示全部

福利制度

【交通便利】◆近捷運站6分鐘(中山國中站) 【薪資與福利】 ◆績效獎金 ◆年度調薪(視公司營運狀況與個人調薪而定) 【請 / 休假制度】 ◆特休假 : 配合勞基法規定 ◆週休二日 ◆依據法規到職即投保勞保、健保

聯絡方式

聯絡人

許小姐

其他

Wonders.ai 是 AI 陪伴領域的領導者,我們的旗艦產品 darlin™ 於 2025 年 7 月 18 日正式上線,短時間內累積超過 20,000 次下載,並與多家國際大型品牌建立合作關係。darlin™ 是一款專為邊緣運算環境設計的 AI 伴侶,能在行動裝置與多平台上提供低延遲、高互動性的沉浸式體驗。 我們服務涵蓋台灣、中國、日本、美國的精英客戶,產業橫跨遊戲、零售、製造與醫療等領域。Wonders.ai 擁有包括 A100 與 H100 GPU 在內的頂尖資源,以及由 10 名專業人士組成的團隊。我們正在尋找對創新充滿熱情並願意全力投入的夥伴,一同實現 3D 角色與人類即時互動的未來。 了解更多請訪問: 官方網站:www.darlin.ai Twitter:twitter.com/darlin_ai Wonders.ai is a leader in AI companionship, with our flagship product darlin™ launched on July 18, 2025, quickly surpassing 20,000 downloads and securing partnerships with major international brands. darlin™ is designed as an edge AI companion, delivering low-latency, highly interactive, and immersive experiences across mobile and multi-platform environments. We serve elite clients in Taiwan, China, Japan, and the USA, spanning industries such as gaming, retail, manufacturing, and healthcare. Equipped with top-tier resources including A100 and H100 GPUs, and supported by a 10-person professional team, we are seeking passionate innovators ready to help shape the future of real-time interaction between 3D characters and humans. Learn more: Website: www.darlin.ai Twitter: twitter.com/darlin_ai Wonders.ai は AI コンパニオン分野のリーダーであり、旗艦製品 darlin™ を 2025 年 7 月 18 日にリリースし、短期間で 20,000 ダウンロードを突破、国際的大手ブランドとのパートナーシップも確立しました。darlin™ は エッジ AI コンパニオン として設計され、モバイルやマルチプラットフォーム環境で低遅延かつ高度なインタラクションと没入感のある体験を提供します。 当社は台湾、中国、日本、米国の一流顧客にサービスを提供しており、ゲーム、小売、製造、医療などの産業に携わっています。A100 および H100 GPU を含む最先端のリソースと 10 名の専門チームを擁し、3D キャラクターと人間のリアルタイムインタラクションの未来を共に築く情熱ある仲間を求めています。 詳細はこちら: 公式サイト:www.darlin.ai Twitter:twitter.com/darlin_ai

應徵回覆

本職務設定1個工作天回覆
104人力銀行提醒您履歷關閉時仍可投遞履歷喔!面試時請遵守求職禮儀準時赴約並小心安全
求職安全專線【勞動部】0800-085-151【104人力銀行】02-29126104轉2 或來信詢問
建議使用104內建訊息功能,以保障您的求職權益,職缺內容可能包含第三方通訊軟體,敬請謹慎評估。
職場安全提醒

適合你大展身手的工作

智能客服
您好,我是您的智能客服 找頭鹿有任何問題都可以問我喔!