ACING: 黑箱LLM指令优化方法
ACING利用演员-评论家方法优化黑箱LLM指令,在30个任务中表现优于基线方法,提升高达39个百分点。
ACING利用演员-评论家方法优化黑箱LLM指令,在30个任务中表现优于基线方法,提升高达39个百分点。
研究利用大型语言模型量化叙述中的信息量,探讨语言交流中意义传递的比特数。
CATCH通过信息瓶颈理论,采用视觉解耦、非视觉筛选和自适应对比解码,缓解大视觉语言模型中的幻觉问题。
研究利用SVM和BERT检测假新闻,采用TF-IDF、Word2Vec和BoW进行文本向量化。结果显示,尽管BERT表现最佳,但SVM结合BoW方法也表现出色,且计算需求更低。
论文探讨了利用Modelica语言对先进热电系统进行稳态初始化的方法,并成功应用于SOS-CO2系统。
研究揭示大型语言模型中的后门攻击机制,利用生成解释技术比较干净与中毒样本,提出检测漏洞的方法。
SparseInfer是一种无需训练的轻量级预测器,通过比较输入和权重的符号位预测ReLU激活稀疏性,实现LLM推理加速,精度损失小于1%。
该研究开发了一种利用大型语言模型的框架,实现美式手语与印度手语的实时翻译,提升手语用户的沟通便利性。通过识别、翻译和手势合成的端到端流程,解决手势多样性和语言差异问题,促进手语社群的交流。
本文提出一种方法,通过结合大语言模型与结构化语义表示,创建多模态知识增强的形式意义表示,提升AI理解复杂场景的能力。
CodeXEmbed是一种大规模代码嵌入模型,支持多语言和多任务代码检索,提升模型泛化能力和检索性能,超越现有SOTA。