直播预告

阅读: 评论:0

直播预告

直播预告

点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

10月21日 19:30~21:00

AI TIME特别邀请了清华大学、加州大学、美国罗格斯大学的三位博士们,为大家带来KDD专场二!

哔哩哔哩直播通道

扫码关注AITIME哔哩哔哩官方账号

观看直播

链接:

★ 嘉宾介绍 ★

赵伯罕

清华大学交叉信息研究院二年级硕士生,主要研究方向为可编程网络和软件定义网络,已在KDD,Infocom,IWQOS等会议发表论文。

报告题目:

面向高速大数据流处理

的自适应分层sketch算法

内容简介:

大数据流处理,亦即统计高速数据流中的数据项出现频率,是数据挖掘应用中的一个关键计算任务。现有解决方案中固定的数据结构限制了测量任务的准确性、吞吐量和通用性。我们提出了一种基于sketch的混合解决方案——动态分层sketch(DHS)。在在线流处理过程中,DHS将数据项散列到各个哈希桶中,并动态组织每个桶中的计数单元:桶中所有单元的内存大小是根据实际流量大小和分布自适应调整的。因此,有限的内存空间能够被高效精确地用来记录大象流的信息,并覆盖更多的老鼠流。同时,DHS按照最长单元匹配(longest fingerprint first)的思路进行流搜索,极大提升了数据结构的操作吞吐。实验评估结果表明,DHS在各类大数据流处理任务上都取得了较好的准确性和高吞吐。

黄泽熙

加州大学圣巴巴拉分校计算机博士生。主要研究方向为图机器学习与数据挖掘。

个人主页: /.

报告题目:

基于随机游走的图嵌入的更广阔图景

内容简介:

基于随机游走的图嵌入为许多与图相关的下游应用提供了解决方法。然而,有关图嵌入的海量文献使得比较现有方法及在它们的基础上创新变得愈发困难。同时,现有的理论无法解释许多很基础的问题,比如说图嵌入是如何抓取到图结构上的不同尺度,以及它应该如何被有效的用于链接预测。本文提出了一个基于随机游走的图嵌入分析框架用于解决这些问题。该框架由三个部分组成:随机游走过程、相似度函数、和嵌入算法。这个框架不仅涵盖了许多现有的方法,而且还能促进新方法的产生。通过这一框架,我们描绘了如何组合不同尺度下的嵌入来达到更优的下游应用的性能,并展现了与采用点间互信息相似度的现有方法相比,基于自协方差相似度的嵌入与点乘排序的组合可以在链接预测上获得超过两倍的性能。

论文代码及数据集已公开:

张登辉

美国罗格斯大学四年级博士生,导师为Hui Xiong教授。主要研究方向为表示学习、商业智能、人才智能计算,目前已经在KDD,AAAI,CIKM,ICDM等会议发表论文 

个人主页:/

报告题目:

基于自适应混合掩码和

最优传输对齐的领域语言预训练

内容简介:

受预训练语言模型(如BERT)在自然语言处理任务中取得广泛成功的启发,目前最新研究在尝试将预训练模型迁移到不同的语言与应用领域。在该方向上,现有的探索研究主要遵循和原始BERT一样的架构,并采用一种直接的方式在领域语料训练模型。然而,面向领域的自然语言任务通常涉及对该领域高频短语的准确理解,而现有的预训练架构很难捕捉到这种细粒度的短语级知识。此外,预训练模型多依赖上下文即单词共现信息学习语义知识,因此可以通过匹配语义相关的实体对的描述文本来增强共现信息。但由于实体对文本缺乏单词级的对齐标签,这种方法可能会引入额外噪声。为了解决上述问题,本文提出一种面向领域语言建模的预训练框架,它利用额外领域知识(领域短语和领域实体关联)从两个方面改进现有的预训练框架。首先,为了有效地融合短语知识,我们构建了一个领域短语池作为辅助工具,同时引入了自适应混合掩码模型来把领域短语知识融入语言模型的训练。它集成了单词学习和短语学习两种学习模式,并能够根据训练进度自适应切换。其次,我们引入了跨实体文本对齐任务来利用实体关联作为弱监督来增强预训练模型的共现信息和语义学习。为了减轻此过程中的潜在噪音,我们提出一种基于最优传输理论的可解释性强的方法来指导跨实体单词对齐的训练。最后,我们的实验显示本文所提出的预训练方法在四个下游任务中(基于产品评论的问答、产品属性提取、产品属性情感分类和产品标题分类)取得了较好的性能,相比于现有的模型有明显的提升。

# 今日视推荐 #

直播结束后我们会邀请讲者在微信群中与大家答疑交流,请添加“AI TIME小助手(微信号:AITIME_HY)”,回复“KDD”,将拉您进“KDD 会议交流群”!

AI TIME微信小助手

主       办:AI TIME 

合作媒体:学术头条、AI 数据派

合作伙伴:智谱·AI、中国工程院知领直播、学堂在线、学术头条、biendata、 Ever链动

AI TIME欢迎AI领域学者投稿,期待大家剖析学科历史发展和前沿技术。针对热门话题,我们将邀请专家一起论道。同时,我们也长期招募优质的撰稿人,顶级的平台需要顶级的你,

请将简历等信息发至yun.he@aminer!

微信联系:AITIME_HY

AI TIME是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造一个知识分享的聚集地。

更多资讯请扫码关注

我知道你“在看”哟~

点击 阅读原文 预约直播!

本文发布于:2024-01-31 12:48:41,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170667652228629.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:预告
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23