Los puntos clave no están disponibles para este artículo en este momento.
El reconocimiento del entorno 3D es esencial para los sistemas de conducción autónoma, ya que los vehículos autónomos requieren una comprensión integral de las escenas circundantes. Recientemente, el enfoque predominante para definir este problema de la vida real es a través de la predicción de ocupación 3D. Este intenta predecir los estados de ocupación y las etiquetas semánticas para todos los vóxeles en el espacio 3D, lo que mejora la capacidad de percepción. La percepción basada en Bird's-Eye-View (BEV) ha alcanzado el rendimiento SOTA para esta tarea. No obstante, esta arquitectura no logra representar diversas escalas de características BEV. En este artículo, inspirados por el éxito de UNet en tareas de segmentación semántica, introducimos un novedoso módulo UNet-like Multi-scale Occupancy Head para aliviar este problema. Además, proponemos la pérdida de balanceo de clases para compensar las clases poco frecuentes en el conjunto de datos. Los resultados experimentales en el conjunto de datos del desafío de ocupación 3D de nuScenes muestran la superioridad de nuestro enfoque propuesto sobre los métodos base y SOTA.
Building similarity graph...
Analyzing shared references across papers
Loading...
Huizhou Chen
Jiangyi Wang
Yuxin Li
Building similarity graph...
Analyzing shared references across papers
Loading...
Chen et al. (Sat,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68e686d2b6db64358760fdcd — DOI: https://doi.org/10.48550/arxiv.2405.16099
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: