Diffusion/FLUX, Wan 2.X и пр.) и фреймворками (Diffusers) практические знания Reinforcement Learning, особенно RLHF уверенное...-генерацию и повышения качества за счет RLHF (Reinforcement Learning from Human Feedback). Обязанности разработка и обучение...