Key points are not available for this paper at this time.
Avanços recentes em Grandes Modelos de Linguagem (LLM) tornaram possível a geração automática de código para tarefas de programação do mundo real em linguagens de programação de uso geral, como Python. No entanto, há poucos estudos humanos sobre a usabilidade dessas ferramentas e como elas se encaixam no fluxo de trabalho de programação. Neste trabalho, conduzimos um estudo com 24 participantes, do tipo within-subjects, para entender como programadores usam e percebem o Copilot, uma ferramenta de geração de código baseada em LLM. Descobrimos que, embora o Copilot não tenha necessariamente melhorado o tempo de conclusão da tarefa ou a taxa de sucesso, a maioria dos participantes preferiu usar o Copilot em tarefas diárias de programação, pois o Copilot frequentemente fornecia um ponto de partida útil e poupava o esforço de buscar online. No entanto, os participantes enfrentaram dificuldades para entender, editar e depurar os trechos de código gerados pelo Copilot, o que prejudicou significativamente sua eficácia na resolução de tarefas. Finalmente, destacamos várias direções promissoras para melhorar o design do Copilot com base em nossas observações e no feedback dos participantes.
Building similarity graph...
Analyzing shared references across papers
Loading...
Priyan Vaithilingam
Tianyi Zhang
Elena L. Glassman
Harvard University
Harvard University Press
Purdue University West Lafayette
Building similarity graph...
Analyzing shared references across papers
Loading...
Vaithilingam et al. (Qua,) estudaram esta questão.
www.synapsesocial.com/papers/69d9d9d0a1d151c65f6854ce — DOI: https://doi.org/10.1145/3491101.3519665