Stanford Seminar - Programming Tools for the Future of Data           Science              

Sarah Chasins 

University of California, Berkeley


21 de Enero de 2022

En el futuro, cualquiera podrá escribir programas que actualmente son dominio exclusivo de los programadores avanzados. Por ahora, todavía hay una gran brecha entre las habilidades de programación de los programadores ocasionales (científicos sociales, periodistas, científicos de datos) y las habilidades requeridas para escribir los programas que quieren. Sin embargo, la necesidad apremia; Si bien hay alrededor de 20 millones de programadores en el mundo, ahora hay al menos el doble de usuarios finales que escriben código para trabajar con datos. En esta charla, describiré Helena, un ecosistema de lenguajes de programación y herramientas de programación que he usado para estudiar cómo podemos apoyar las necesidades de programación de los científicos sociales. Los no programadores utilizan Helena para recopilar conjuntos de datos de la web y, en términos más generales, para desarrollar programas de automatización web personalizados. Reúne las siguientes innovaciones clave: (i) El entorno de programación de Helena utiliza Programación por Demostración (PBD); requiere un enfoque de aprendizaje de disparo único, sintetizando guiones basados ​​en la grabación de una demostración de un solo usuario. (ii) El reproductor adaptativo de Helena hace que los scripts sean resistentes a los rediseños y la ofuscación de páginas web, lo que permite experimentos longitudinales. (iii) Con construcciones de lenguaje novedosas, los no codificadores pueden realizar tareas de programación que generalmente se limitan a programadores expertos, por ejemplo, recuperación de fallas, paralelización.

La construcción de Helena exigió conocimientos novedosos en el dominio de la automatización web, pero también requirió un nuevo enfoque de diseño, una unión estrechamente acoplada de técnicas de lenguajes de programación (PL) e interacción humano-computadora (HCI). Conectaré este trabajo con una discusión sobre cómo mi laboratorio reúne técnicas de PL y HCI y por qué la combinación PL-HCI es tan poderosa para democratizar la computación 

Comentarios

Entradas populares de este blog

Support Vector Machine (SVM) in 2 minutes