You can find the main data card on the GEM Website .
CrossWOZ is a Chinese multi-domain task-oriented dialogue dataset . It contains 6K dialogue sessions and 102K utterances for 5 domains, including hotel, restaurant, attraction, metro, and taxi. About 60{%} of the dialogues have cross-domain user goals that favor inter-domain dependency and encourage natural transition across domains in conversation.
You can load the dataset via:
import datasets data = datasets.load_dataset('GEM/CrossWOZ')
The data loader can be found here .
website paper authorsQi Zhu, Kaili Huang, Zheng Zhang, Xiaoyan Zhu, and Minlie Huang from CoAI group, Tsinghua University
@article{zhu-etal-2020-crosswoz, title = "{C}ross{WOZ}: A Large-Scale {C}hinese Cross-Domain Task-Oriented Dialogue Dataset", author = "Zhu, Qi and Huang, Kaili and Zhang, Zheng and Zhu, Xiaoyan and Huang, Minlie", journal = "Transactions of the Association for Computational Linguistics", volume = "8", year = "2020", url = "https://aclanthology.org/2020.tacl-1.19", doi = "10.1162/tacl_a_00314", pages = "281--295", abstract = "To advance multi-domain (cross-domain) dialogue modeling as well as alleviate the shortage of Chinese task-oriented datasets, we propose CrossWOZ, the first large-scale Chinese Cross-Domain Wizard-of-Oz task-oriented dataset. It contains 6K dialogue sessions and 102K utterances for 5 domains, including hotel, restaurant, attraction, metro, and taxi. Moreover, the corpus contains rich annotation of dialogue states and dialogue acts on both user and system sides. About 60{\%} of the dialogues have cross-domain user goals that favor inter-domain dependency and encourage natural transition across domains in conversation. We also provide a user simulator and several benchmark models for pipelined task-oriented dialogue systems, which will facilitate researchers to compare and evaluate their models on this corpus. The large size and rich annotation of CrossWOZ make it suitable to investigate a variety of tasks in cross-domain dialogue modeling, such as dialogue state tracking, policy learning, user simulation, etc.", }Contact Name
Qi Zhu
Contact Emailzhuq96@gmail.com
Has a Leaderboard?no
no
Covered LanguagesChinese
Licenseapache-2.0: Apache License 2.0
Intended UseCrossWOZ is the first large-scale Chinese Cross-Domain Wizard-of-Oz task-oriented dataset. It contains 6K dialogue sessions and 102K utterances for 5 domains, including hotel, restaurant, attraction, metro, and taxi. Moreover, the corpus contains rich annotation of dialogue states and dialogue acts at both user and system sides. We also provide a user simulator and several benchmark models for pipelined taskoriented dialogue systems, which will facilitate researchers to compare and evaluate their models on this corpus.
Primary TaskDialog Response Generation
Communicative GoalGenerate a response according to the dialog context and database search results.
academic
Curation Organization(s)Tsinghua University
Dataset CreatorsQi Zhu, Kaili Huang, Zheng Zhang, Xiaoyan Zhu, and Minlie Huang from CoAI group, Tsinghua University
FundingNational Science Foundation of China, National Key R&D Program of China
Who added the Dataset to GEM?Qi Zhu (Tsinghua University)
{'dialog_id': '2303', 'final_goal': [['1', '餐馆', '人均消费', '50-100元', 'True'], ['1', '餐馆', '推荐菜', "['美食街']", 'True'], ['1', '餐馆', '名称', '鲜鱼口老字号美食街', 'True'], ['1', '餐馆', '营业时间', '周一至周日 10:00-22:00', 'True'], ['1', '餐馆', '周边景点', "['天安门广场', '前门大街', '恭王府', '故宫']", 'True'], ['2', '景点', '名称', '故宫', 'True'], ['2', '景点', '评分', '4.5分以上', 'True'], ['2', '景点', '地址', '北京市东城区景山前街4号', 'True'], ['2', '景点', '电话', '010-85007938', 'True'], ['3', '酒店', '名称', '桔子水晶酒店(北京安贞店)', 'True'], ['3', '酒店', '电话', '010-84273030', 'True']], 'gem_id': 'GEM-CrossWOZ-test-0', 'goal': [['1', '餐馆', '人均消费', '50-100元', 'False'], ['1', '餐馆', '推荐菜', "['美食街']", 'False'], ['1', '餐馆', '名称', '', 'False'], ['1', '餐馆', '营业时间', '', 'False'], ['1', '餐馆', '周边景点', '[]', 'False'], ['2', '景点', '名称', '出现在id=1的周边景点里', 'False'], ['2', '景点', '评分', '4.5分以上', 'False'], ['2', '景点', '地址', '', 'False'], ['2', '景点', '电话', '', 'False'], ['3', '酒店', '名称', '桔子水晶酒店(北京安贞店)', 'False'], ['3', '酒店', '电话', '', 'False']], 'messages': {'content': ['你好,我想吃美食街,帮我推荐一个人均消费在50-100元的餐馆,谢谢。', '为您推荐鲜鱼口老字号美食街,人均消费75元,有您想吃的美食街哦。', '营业时间是什么时间?', '周一至周日 10:00-22:00。', '他家周边有什么景点吗?', '有故宫, 前门大街, 恭王府, 天安门广场。', '哦,我想在这些附近景点里找一个4.5分以上的,有吗?', '故宫就是哦,4.7分。', '好的,电话和地址告诉我一下。', '010-85007938;北京市东城区景山前街4号。', '好的,麻烦你帮我查一下桔子水晶酒店(北京安贞店)电话呗。', '010-84273030。', '好的,收到,谢谢你!', '不客气。'], 'dialog_act': [[['General', 'greet', 'none', 'none'], ['General', 'thank', 'none', 'none'], ['Inform', '餐馆', '人均消费', '50-100元'], ['Inform', '餐馆', '推荐菜', '美食街'], ['Request', '餐馆', '名称', '']], [['Inform', '餐馆', '人均消费', '75元'], ['Inform', '餐馆', '名称', '鲜鱼口老字号美食街']], [['Request', '餐馆', '营业时间', '']], [['Inform', '餐馆', '营业时间', '周一至周日 10:00-22:00']], [['Request', '餐馆', '周边景点', '']], [['Inform', '餐馆', '周边景点', '前门大街'], ['Inform', '餐馆', '周边景点', '天安门广场'], ['Inform', '餐馆', '周边景点', '恭王府'], ['Inform', '餐馆', '周边景点', '故宫']], [['Inform', '景点', '评分', '4.5分以上'], ['Select', '景点', '源领域', '餐馆']], [['Inform', '景点', '名称', '故宫'], ['Inform', '景点', '评分', '4.7分']], [['Request', '景点', '地址', ''], ['Request', '景点', '电话', '']], [['Inform', '景点', '地址', '北京市东城区景山前街4号'], ['Inform', '景点', '电话', '010-85007938']], [['Inform', '酒店', '名称', '桔子水晶酒店(北京安贞店)'], ['Request', '酒店', '电话', '']], [['Inform', '酒店', '电话', '010-84273030']], [['General', 'thank', 'none', 'none']], [['General', 'welcome', 'none', 'none']]], 'role': ['usr', 'sys', 'usr', 'sys', 'usr', 'sys', 'usr', 'sys', 'usr', 'sys', 'usr', 'sys', 'usr', 'sys'], 'sys_state': [{'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': ['鲜鱼口老字号美食街'], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': ['鲜鱼口老字号美食街'], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': ['鲜鱼口老字号美食街'], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': ['故宫'], '名称': '故宫', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': ['故宫'], '名称': '故宫', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '故宫', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': ['桔子水晶酒店(北京安贞店)'], '价格': '', '名称': '桔子水晶酒店(北京安贞店)', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '故宫', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '桔子水晶酒店(北京安贞店)', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}], 'sys_state_init': [{'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': ['鲜鱼口老字号美食街'], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': ['鲜鱼口老字号美食街'], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': ['鲜鱼口老字号美食街'], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': ['故宫'], '名称': '故宫', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': ['鲜鱼口老字号美食街'], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': ['故宫'], '名称': '故宫', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': ['故宫'], '名称': '故宫', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': ['桔子水晶酒店(北京安贞店)'], '价格': '', '名称': '桔子水晶酒店(北京安贞店)', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': [], '价格': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '', '评分': ''}}, {'出租': {'selectedResults': [], '出发地': '', '目的地': ''}, '地铁': {'selectedResults': [], '出发地': '', '目的地': ''}, '景点': {'selectedResults': [], '名称': '故宫', '周边景点': '', '周边酒店': '', '周边餐馆': '', '游玩时间': '', '评分': '', '门票': ''}, '酒店': {'selectedResults': ['桔子水晶酒店(北京安贞店)'], '价格': '', '名称': '桔子水晶酒店(北京安贞店)', '周边景点': '', '周边酒店': '', '周边餐馆': '', '评分': '', '酒店类型': '', '酒店设施': ''}, '餐馆': {'selectedResults': [], '人均消费': '50-100元', '名称': '', '周边景点': '', '周边酒店': '', '周边餐馆': '', '推荐菜': '美食街', '评分': ''}}], 'user_state': [[['1', '餐馆', '人均消费', '50-100元', 'True'], ['1', '餐馆', '推荐菜', "['美食街']", 'True'], ['1', '餐馆', '名称', '', 'True'], ['1', '餐馆', '营业时间', '', 'False'], ['1', '餐馆', '周边景点', '[]', 'False'], ['2', '景点', '名称', '出现在id=1的周边景点里', 'False'], ['2', '景点', '评分', '4.5分以上', 'False'], ['2', '景点', '地址', '', 'False'], ['2', '景点', '电话', '', 'False'], ['3', '酒店', '名称', '桔子水晶酒店(北京安贞店)', 'False'], ['3', '酒店', '电话', '', 'False']], [], [['1', '餐馆', '人均消费', '50-100元', 'True'], ['1', '餐馆', '推荐菜', "['美食街']", 'True'], ['1', '餐馆', '名称', '鲜鱼口老字号美食街', 'True'], ['1', '餐馆', '营业时间', '', 'True'], ['1', '餐馆', '周边景点', '[]', 'False'], ['2', '景点', '名称', '出现在id=1的周边景点里', 'False'], ['2', '景点', '评分', '4.5分以上', 'False'], ['2', '景点', '地址', '', 'False'], ['2', '景点', '电话', '', 'False'], ['3', '酒店', '名称', '桔子水晶酒店(北京安贞店)', 'False'], ['3', '酒店', '电话', '', 'False']], [], [['1', '餐馆', '人均消费', '50-100元', 'True'], ['1', '餐馆', '推荐菜', "['美食街']", 'True'], ['1', '餐馆', '名称', '鲜鱼口老字号美食街', 'True'], ['1', '餐馆', '营业时间', '周一至周日 10:00-22:00', 'True'], ['1', '餐馆', '周边景点', '[]', 'True'], ['2', '景点', '名称', '出现在id=1的周边景点里', 'False'], ['2', '景点', '评分', '4.5分以上', 'False'], ['2', '景点', '地址', '', 'False'], ['2', '景点', '电话', '', 'False'], ['3', '酒店', '名称', '桔子水晶酒店(北京安贞店)', 'False'], ['3', '酒店', '电话', '', 'False']], [], [['1', '餐馆', '人均消费', '50-100元', 'True'], ['1', '餐馆', '推荐菜', "['美食街']", 'True'], ['1', '餐馆', '名称', '鲜鱼口老字号美食街', 'True'], ['1', '餐馆', '营业时间', '周一至周日 10:00-22:00', 'True'], ['1', '餐馆', '周边景点', "['天安门广场', '前门大街', '恭王府', '故宫']", 'True'], ['2', '景点', '名称', '出现在id=1的周边景点里', 'True'], ['2', '景点', '评分', '4.5分以上', 'True'], ['2', '景点', '地址', '', 'False'], ['2', '景点', '电话', '', 'False'], ['3', '酒店', '名称', '桔子水晶酒店(北京安贞店)', 'False'], ['3', '酒店', '电话', '', 'False']], [], [['1', '餐馆', '人均消费', '50-100元', 'True'], ['1', '餐馆', '推荐菜', "['美食街']", 'True'], ['1', '餐馆', '名称', '鲜鱼口老字号美食街', 'True'], ['1', '餐馆', '营业时间', '周一至周日 10:00-22:00', 'True'], ['1', '餐馆', '周边景点', "['天安门广场', '前门大街', '恭王府', '故宫']", 'True'], ['2', '景点', '名称', '故宫', 'True'], ['2', '景点', '评分', '4.5分以上', 'True'], ['2', '景点', '地址', '', 'True'], ['2', '景点', '电话', '', 'True'], ['3', '酒店', '名称', '桔子水晶酒店(北京安贞店)', 'False'], ['3', '酒店', '电话', '', 'False']], [], [['1', '餐馆', '人均消费', '50-100元', 'True'], ['1', '餐馆', '推荐菜', "['美食街']", 'True'], ['1', '餐馆', '名称', '鲜鱼口老字号美食街', 'True'], ['1', '餐馆', '营业时间', '周一至周日 10:00-22:00', 'True'], ['1', '餐馆', '周边景点', "['天安门广场', '前门大街', '恭王府', '故宫']", 'True'], ['2', '景点', '名称', '故宫', 'True'], ['2', '景点', '评分', '4.5分以上', 'True'], ['2', '景点', '地址', '北京市东城区景山前街4号', 'True'], ['2', '景点', '电话', '010-85007938', 'True'], ['3', '酒店', '名称', '桔子水晶酒店(北京安贞店)', 'True'], ['3', '酒店', '电话', '', 'True']], [], [['1', '餐馆', '人均消费', '50-100元', 'True'], ['1', '餐馆', '推荐菜', "['美食街']", 'True'], ['1', '餐馆', '名称', '鲜鱼口老字号美食街', 'True'], ['1', '餐馆', '营业时间', '周一至周日 10:00-22:00', 'True'], ['1', '餐馆', '周边景点', "['天安门广场', '前门大街', '恭王府', '故宫']", 'True'], ['2', '景点', '名称', '故宫', 'True'], ['2', '景点', '评分', '4.5分以上', 'True'], ['2', '景点', '地址', '北京市东城区景山前街4号', 'True'], ['2', '景点', '电话', '010-85007938', 'True'], ['3', '酒店', '名称', '桔子水晶酒店(北京安贞店)', 'True'], ['3', '酒店', '电话', '010-84273030', 'True']], []]}, 'sys_id': 96, 'task description': ['你要去一个餐馆(id=1)用餐。你希望餐馆的人均消费是50-100元的。你想吃的菜肴是美食街。你想知道这个餐馆的名称、营业时间、周边景点。', '你要去id=1附近的景点(id=2)游玩。你希望景点的评分是4.5分以上。你想知道这个景点的地址、电话。', '你要去名叫桔子水晶酒店(北京安贞店)的酒店(id=3)住宿。你想知道这个酒店的电话。'], 'type': '不独立多领域', 'usr_id': 97}Data Splits
Split | Train | Valid | Test |
---|---|---|---|
# dialogues | 5,012 | 500 | 500 |
# Turns (utterances) | 84,692 | 8,458 | 8,476 |
Vocab | 12,502 | 5,202 | 5,143 |
Avg. sub-goals | 3.24 | 3.26 | 3.26 |
Avg. semantic tuples | 14.8 | 14.9 | 15.0 |
Avg. turns | 16.9 | 16.9 | 17.0 |
Avg. tokens per turn | 16.3 | 16.3 | 16.2 |
CrossWOZ is the first large-scale Chinese Cross-Domain Wizard-of-Oz task-oriented dataset.
Similar Datasetsyes
Unique Language Coverageno
Difference from other GEM datasetsThe corpus contains rich annotation of dialogue states and dialogue acts at both user and system sides, which can be used in a wide range of tasks.
Ability that the Dataset measuresDialog understanding, dialog policy learning
yes
GEM Modificationsother
Modification DetailsTo adapt to hugging face Datasets, we 1) separate user annotators' ID and system annotations' ID; 2) we convert the data type in goal/user state to string.
Additional Splits?no
According to the type of user goal, we group the dialogues in the training set into five categories:
Dialog understanding, dialog policy learning
MetricsBLEU
Proposed EvaluationBLEU evaluates the generation quality.
Previous results available?yes
Other Evaluation ApproachesInform rate: how many entities in the gold response appear in the generated response.
Relevant Previous ResultsBLEU on MultiWOZ dataset.
Gather human-to-human dialog in Chinese.
Communicative GoalGenerate a response according to the dialog context and database search results.
Sourced from Different Sourcesno
Crowdsourced
Where was it crowdsourced?Participatory experiment
Language ProducersAn usr/sys ID indicates the creator of different data points.
Topics Covereddomains: attraction, hotel, restaurant, metro, taxi
Data Validationvalidated by data curator
Was Data Filtered?not filtered
none
Annotation Service?no
yes
Consent Policy DetailsAnnotators agree using the dataset for research purpose.
Other Consented Downstream UseAny
unlikely
Categories of PIIgeneric PII
Any PII Identification?no identification
no
no
yes
Details on how Dataset Addresses the NeedsCrossWOZ is the first large-scale Chinese Cross-Domain Wizard-of-Oz task-oriented dataset. The corpus contains rich annotation of dialogue states and dialogue acts at both user and system sides, which can be used in a wide range of tasks.
no
Are the Language Producers Representative of the Language?Yes
No
open license - commercial use allowed
Copyright Restrictions on the Language Dataopen license - commercial use allowed
No
Unsuited ApplicationsModel may not handle unknown values in the dialog
Discouraged Use CasesResponses can be diverse, which is not captured by BLEU