Introduction As part of a cooperation project with the Deutsches Elektronen-Synchrotron (DESY), a safe, learning-enabled control framework is to be developed for an autonomous mobile robot that is to be used for radiation measurement and maintenance tasks in particle accelerator tunnels. It should be able to recognize obstacles independently, avoid collisions with them and carry out tasks independently. Conventional robotics approaches work with predefined trajectories, which restrict them to an isolated work area and a controlled environment free of obstacles [1].
Various methods to construct saliency maps are evaluated quantitatively with regards to their correctness. This is done in a reinforcement learning setting with DQN and Atari Breakout. The considered saliency map methods include multiple …
Ziel dieser Arbeit ist die Lösung eines Sparse-Reward-Problems, mithilfe von Reward-Shaping und Curriculum-Learning, in einem Adversarial Game-Environment. Dazu wurde in Unity 3D ein 1 vs. 1 Shooter-Environment im Stil von Laser-Tag aufgebaut, in dem …
Das Training eines auf Reinforcement Learning basierenden Agenten gestaltet sich auf physischer Hardware ressourcen-, personal- und zeitaufwändig, weshalb häufig auf das Trainieren innerhalb von Simulationen zurückgegriffen wird. Diese ko ̈nnen die …
This project report describes the integration of reinforcement learning into a game development scenario by creating a competitive volleyball game using the Unity ML-Agents Toolkit. The work elaborates on what reinforcement learning is, brings forth …
The Reinforcement Learning algorithm Double Deep Q-Network (DDQN) is known to have an unstable training process (Halat and Ebadzadeh, 2021). In order to overcome instability, this paper aims to deepen the understanding of stability and measuring it. …
Eine der beliebtesten Herausforderungen der letzten Jahre auf dem Gebiet der künstlichen Intelligenz ist die Entwicklung von Agenten, die in der Lage sind, das Spielen von klassischen Videospielen zu perfektionieren. Diese Arbeit diskutiert den …
Verglichen werden die drei Reinforment Lernening Verfahren Cross-Entropy-Method, REINFORCE und Advantage Actor Critic. Für die beiden Environments CartPole und Breakout sollen Policys erlernt werden und an Hand der Returns dieser Policys werden die …
Reinforcement learning (RL) is an area of machine learning concerned with how intelligent agents ought to take actions in an environment in order to maximize the notion of cumulative reward. The purpose of reinforcement learning is for the agent to …
Im Multiagent Reinforcement Learning (MARL) wird eine effektive Integration von Methoden des Reinforcement Learning (RL) und Multiagentensystemen (MAS) angestrebt. Mithilfe einer Menge adaptiver und lernender Agenten in einem verteilten intelligenten …