Page 1 | Search Results | APSIPA Transactions on Signal and Information Processing

1-2 of 2

Sort by

Journal Articles

Robust Multi-Domain Multi-Turn Dialogue Policy via Student-Teacher Offline Reinforcement Learning

APSIPA Transactions on Signal and Information Processing (2024) 13 (1): 1–26.

https://doi.org/10.1561/116.20240024

Published: 09 September 2024

... system dialogue policy optimization student-teacher learning offline reinforcement learning Designing a faultless dialogue system is challenging, especially in the case of multi-domain multi-turn dialogue tasks where each conversation with multiple turns may comprise multiple domains...

View article titled, Robust Multi-Domain Multi-Turn Dialogue Policy via Student-Teacher Offline Reinforcement Learning

Add to Citation Manager for Robust Multi-Domain Multi-Turn Dialogue Policy via Student-Teacher Offline Reinforcement Learning

Journal Articles

Advances and Challenges in Multi-Domain Task-Oriented Dialogue Policy Optimization

Mahdin Rohmatillah, Jen-Tzung Chien

APSIPA Transactions on Signal and Information Processing (2023) 12 (1): 1–52.

https://doi.org/10.1561/116.00000132

Published: 05 September 2023

... within a short conversation. Furthermore, offering the precise answers to satisfy the user requirements makes the task even more challenging. This paper surveys recent advances in multi-domain task-oriented dialogue policy optimization and summarizes a number of solutions to policy learning...

View article titled, Advances and Challenges in Multi-Domain Task-Oriented Dialogue Policy Optimization

Add to Citation Manager for Advances and Challenges in Multi-Domain Task-Oriented Dialogue Policy Optimization

Update search

NARROW

Format

Journal

Type

Date

Availability

Robust Multi-Domain Multi-Turn Dialogue Policy via Student-Teacher Offline Reinforcement Learning

Advances and Challenges in Multi-Domain Task-Oriented Dialogue Policy Optimization

Email alerts

Update search

Robust Multi-Domain Multi-Turn Dialogue Policy via Student-Teacher Offline Reinforcement Learning

Advances and Challenges in Multi-Domain Task-Oriented Dialogue Policy Optimization

Email alerts

Sharing Unavailable