Euery

2024-11-21

2024-11-19

ACING利用演员-评论家方法优化黑箱LLM指令，在30个任务中表现优于基线方法，提升高达39个百分点。

2024-11-19

研究利用大型语言模型量化叙述中的信息量，探讨语言交流中意义传递的比特数。

2024-11-19

CATCH通过信息瓶颈理论，采用视觉解耦、非视觉筛选和自适应对比解码，缓解大视觉语言模型中的幻觉问题。

2024-11-19

研究利用SVM和BERT检测假新闻，采用TF-IDF、Word2Vec和BoW进行文本向量化。结果显示，尽管BERT表现最佳，但SVM结合BoW方法也表现出色，且计算需求更低。

2024-11-19

论文探讨了利用Modelica语言对先进热电系统进行稳态初始化的方法，并成功应用于SOS-CO2系统。

2024-11-19

研究揭示大型语言模型中的后门攻击机制，利用生成解释技术比较干净与中毒样本，提出检测漏洞的方法。

2024-11-19

SparseInfer是一种无需训练的轻量级预测器，通过比较输入和权重的符号位预测ReLU激活稀疏性，实现LLM推理加速，精度损失小于1%。

2024-11-19

该研究开发了一种利用大型语言模型的框架，实现美式手语与印度手语的实时翻译，提升手语用户的沟通便利性。通过识别、翻译和手势合成的端到端流程，解决手势多样性和语言差异问题，促进手语社群的交流。

2024-11-19

本文提出一种方法，通过结合大语言模型与结构化语义表示，创建多模态知识增强的形式意义表示，提升AI理解复杂场景的能力。

2024-11-19

CodeXEmbed是一种大规模代码嵌入模型，支持多语言和多任务代码检索，提升模型泛化能力和检索性能，超越现有SOTA。