Project README

Actor-Critic

Solution for Lunar Lander environment v2 of Open AI gym. The algorithm used is actor-critic (vanilla policy gradient with baseline),

more info : http://rail.eecs.berkeley.edu/deeprlcourse-fa17/f17docs/lecture_5_actor_critic_pdf.pdf

-> Dependencies:

    OpenAI gym

    PyTorch 0.4.1

    PIL

-> Hyperparameters can be changed by editing them in respective files

-> To train : run train.py

-> Converges within 1500 episodes

-> To test a pretrained model : run test.py

alt-text

Open Source Agenda is not affiliated with "Actor Critic PyTorch" Project. README Source: nikhilbarhate99/Actor-Critic-PyTorch

Stars

Open Issues

Last Commit

5 years ago

Repository

nikhilbarhate99/Actor-Critic-PyTorch

License

BSD-3-Clause

Open Source Agenda Badge

<a href="https://www.opensourceagenda.com/projects/actor-critic-pytorch"><img src="https://www.opensourceagenda.com/projects/actor-critic-pytorch/reviews/badge.svg" alt="Open Source Agenda"></a>

Submit Review Review Your Favorite Project

Submit Resource Articles, Courses, Videos

Submit Article Submit a post to our blog

From the blog

Dec 11, 2022

Actor Critic PyTorch Save

Actor-Critic

Open Source Agenda Badge

From the blog

How to Choose Which Programming Language to Learn First?

From the blog

How to Choose Which Programming Language to Learn First?