计算机学院 School of Computer Science and Technology
讲师
当前位置: 首页 > 师资队伍 > 软件工程系 > 讲师 > 正文

赵阳洋

发布时间: 2023-10-30 14:43:50 浏览量:

taptap点点体育计算机学院究生导师基本信息表

1、个人基本信息:

 名:阳洋

 别:

19CCF

出生年月:1995.12

技术职称:讲师

毕业院校华南理工大学

学历(学位):博士

所在学科:软件工程


研究方向:强化学习、大模型、人机交互

2、教育背景:

2017.09----2022.12

华南理工大学大学

博士

2021.11----2022.11

Utrecht University

联合培养博士

3、 目前研究领域:

强化学习、大语言模型、人机交互、情感计算

4、已完成或已在承担的主要课题:

1、国家自然科学基金青年项目主持,30万

2、基于大模型和强化学习的任务驱动-情绪感知型对话策略研究湖南省自然科学基金青年项目主持,5万

3、国家自然科学基金面上项目,参与,50万

4、广东省重点领域研发计划项目,新一代人工智能专项,参与,10000万

5、广东省基础与应用基础研究基金,面上项目,参与,10万元

6、广州市科技计划项目,广州市产业技术重大攻关计划-现代产业技术专题项目,参与,1400万元

7、广东省应用型科技研发专项资金项目重点项目,参与,400万元

5、已出版的主要著作:

《人工智能导论》 王威、邓泽林、曹嵘晖、王新、彭鑫、赵阳洋

6、已发表的学术论文:

[1] Yangyang Zhao, linfan Dai, Li Cai, Bowen Xing, Libo Qin*.Bridging Reasoning and Action: Hybrid LLMRL Framework for Efficient Cross-Domain Task-Oriented Dialogue.findings of the Annual Meeting of the Association for Computational Linguistics, 2026. (ACLCCF-A

[2] Yangyang Zhao, Ben Niu, Libo Qin*, Shihan Wang. An Efficient Task-Oriented Dialogue Policy: Evolutionary Reinforcement Learning Injected by Elite Individuals, Proceedings of the Annual Meeting of the Association for Computational Linguistics, 2025, 3429-3442. (ACLCCF-A

[3] Yangyang Zhao, Ben Niu, Yuxuan Tan, Shihan Wang, Libo Qin*. Semantic-Aware Action Space Compression via LLM-DRL Synergy for Efficient Task-oriented Dialogue Policy Exploration. Findings of Empirical Methods in Natural Language Processing, 2025. (EMNLP, CCF-B)

[4] Yangyang Zhao, Jinchuan Long*, Mehdi Dastani, Shihan Wang. Rescue Conversations from Dead-ends: Efficient Exploration for Task-oriented Dialogue Policy

Optimization. Transactions of the Association for Computational Linguistics, 2024. (TACL,一区TOP期刊)

[5] Yangyang Zhao, Hua Qin, Zhenyu Wang, Mehdi Dastani*, Shihan Wang*. Decomposed Deep-Q Network for Efficient Dialogue Policy Learning. IEEE Trans. Audio, Speech, and Lang. Process. (TASLP,一区TOP期刊)

[7]Yangyang Zhao, Ben Niu, Mehdi Dastani*, Shihan Wang*. Bootstrapped Policy Learning for Task-oriented Dialogue through Goal Shaping. EMNLP 2024. (CCF-B)

[8] Yangyang Zhao, Mehdi Dastani*, Shihan Wang*. Bootstrapped Policy Learning: Goal Shaping for Efficient Task-oriented Dialogue Policy Learning. AAMAS 2024. (CCF-B)

[9] Yangyang Zhao, Zhenyu Wang*, Zhenhua Huang. Automatic Curriculum Learning With Over-repetition Penalty for Dialogue Policy Learning. AAAI 2021. (CCF-A)

[10] Yangyang Zhao, Zhenyu Wang*, Kai Yin, Rui Zhang, Zhenhua Huang, Pei Wang. Dynamic Reward-based Dueling Deep Dyna-Q: Robust Policy Learning in Noisy Environments. AAAI 2020.oral (CCF-A)

[11] Yangyang Zhao, Zhenyu Wang *, Changxi Zhu, Shihan Wang. Complementary Policy Learning from Episodic Memory Policy and DQN Policy. EMNLP 2021. (CCF-B)

[12] Yangyang Zhao, Hua Qin, Zhenyu Wang*, Changxi Zhu, Shihan Wang*. A Versatile Adaptive Curriculum Learning Framework for Task-oriented Dialogue Policy Learning. NAACL 2022. (CCF-B)

[13] 赵阳洋,王振宇*,王佩,杨添,张睿,尹凯. 任务型对话系统研究综述. 计算机学报, 2020, 43(10): 1862-1896. (CCF-T1)


7、 所获学术荣誉及学术影响:

指导研究生学生获奖情况:
“华为杯”中国研究生人工智能创新大赛(2024)(全国二等奖)

湖南省研究生计算机创新大赛(2024)(湖南省一等奖,优秀指导老师)

指导本科生获奖情况:

CCF-开源大赛 (2024)(全国一等奖)

中国大学生服务外包创新大赛(2024)(全国二等奖)

中国机器人及人工智能大赛(2024)(全国二等奖)

蓝桥杯数字科技创新赛(2024)(全国三等奖)

中国大学生计算机设计大赛(2024)(中南赛区一等奖)

海峡两岸暨港澳地区大学生计算机创新作品赛(2024)(湖南省三等奖)

学术兼职:
中文信息学会青年委员,情感计算转为委员,计算机学会会员等

ACL, EMNLP, NAACL, COLING, AAAIIJCAI等人工智能及自然语言处理领域顶级会议审稿人

TACLTASLPKBSNN、等国际权威期刊审稿人

国家自然科学基金、广东省基金评审专家

8、 招生宣言

团队长年招收硕士研究生、本科生!

这里氛围轻松、指导细致,从入门到上手全程带飞,帮你把兴趣变成能力。

无论你是想保研考研、发论文、打竞赛,还是提升硬核技术,都欢迎来聊~

联系方式:yyz@csust.edu.cn



上一篇:乃科

下一篇:徐聪

Copyright © 2020 All Right Reserved taptap点点体育 计算机学院 版权所有

地址:长沙市天心区赤岭路45号taptap点点体育金盆岭校区电苑楼 电话:0731-85258462