订阅小程序
旧版功能

Cost-Efficient LLM Serving in the Cloud: VM Selection with KV Cache Offloading

Kihyun Kim,Jinwoo Kim, Hyunsun Chung, Myung-Hoon Cha,Hong-Yeon Kim,Youngjae Kim

arxiv(2025)

引用 0|浏览3
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要