Обучение с подкреплением - это метод машинного обучения, который используется для обучения агентов принимать решения в неопределенных средах. В играх и роботах это особенно полезно, так как позволяет создавать интеллектуальных агентов, способных самостоятельно учиться и принимать оптимальные решения.