What question did this study set out to answer?

The aim is to develop a deep reinforcement learning model that enhances humanoid robot navigation and task scheduling within automated supply chains.

April 10, 2026

A Deep Reinforcement Learning Model for Humanoid Robot Navigation and Task Scheduling in Automated Supply Chains

Key Points

The aim is to develop a deep reinforcement learning model that enhances humanoid robot navigation and task scheduling within automated supply chains.
Utilized the PO-TSATD3 model for robot navigation and scheduling tasks.
Simulated real-world logistics scenarios with dynamic obstacles and varying workloads.
Employed data preparation techniques for normalization and quality control.
Conducted Python simulations to test the effectiveness of the proposed methods.
Achieved significant improvements in navigation accuracy compared to traditional methods.
Reduced collision rates during robot navigation tasks.
Enhanced scheduling efficiency within complex supply chain environments.
Validated the model's scalability and robustness in dynamic situations.

Abstract

Humanoid robots must navigate, decide, and schedule efficiently to boost automated supply chain efficiency. Traditional rule-based techniques fail in dynamic situations, especially with task dependencies. A unique Puma Optimizer-mutated Twin-Stage Adaptive Twin-Delayed Deep Deterministic Policy Gradient (PO-TSATD3) method is used in this deep reinforcement learning system. Training datasets imitate real-world logistics situations with dynamic impediments, many robots, and varying workloads. Data preparation cleans and normalizes for quality. The Puma Optimizer optimises convergence and operating efficiency, while the PO-TSATD3 framework improves navigation and scheduling adaptive learning. Python simulations show considerable gains in navigation accuracy, collision reduction, and schedule optimization over conventional methods. The model's outstanding performance metrics proved its scalability and durability in complicated situations. This research validates the application of deep reinforcement learning, augmented by PO-TSATD3, as a powerful solution for intelligent humanoid robot operations in future supply chain systems.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jiadong Zhang

Wei Wang

Journals

International Journal of Humanoid Robotics

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

A Deep Reinforcement Learning Model for Humanoid Robot Navigation and Task Scheduling in Automated Supply Chains

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider