2 871 419 libros electrónicos en 110 idiomas
¿No le conviene? No hay problema. Puede devolverlo en un plazo de 30 días
No se equivocará con un vale de regalo. El destinatario puede elegir cualquier producto de nuestra oferta.
Política de devolución de 30 días
Presents sequential decision theory from a novel algorithmic information theory perspective. This book introduces the two different ideas and removes the limitations by unifying them to one parameter-free theory of an optimal reinforcement learning agent embedded in an unknown environment.