Tabla de Contenidos
Memoria
La memoria es un informe que describe un trabajo novedoso de ingeniería, ciencia o matemática, muestra la aplicación del conocimiento adquirido durante la carrera de Ingeniería Civil en Computación, es acorde con un trabajo de un semestre, y demuestra las habilidades esperadas de un egresado de esta carrera.
- Un trabajo de ingeniería supone la identificación y caracterización de un problema práctico, y el diseño, desarrollo, aplicación y validación de una solución novedosa del mismo.
- Un trabajo de ciencia supone la propuesta de una hipótesis relacionada con un problema científico abierto, y el diseño y la ejecución de un método para intentar validar o rechazar la misma.
- Un trabajo matemático supone la propuesta de un problema abierto en algún ámbito teórico de computación, la formalización del mismo como un teorema (o una serie de teoremas), y el desarrollo de demostraciones para afirmar su veracidad.
- Se considera que un trabajo de memoria requiere del conocimiento adquirido durante la carrera, si éste depende del conocimiento adquirido en al menos un curso obligatorio de especialización de la carrera, o en un curso electivo que tenga un curso obligatorio de especialización de la carrera como requisito.
- Se considera que el trabajo cumple con una carga laboral de un semestre, si es factible que un egresado de esta carrera lo realice en un semestre (jornada completa). Si se requiere menos tiempo, entonces el trabajo no cumple con la carga laboral exigida.
- Se considera que el trabajo de memoria demuestra las habilidades esperadas de un egresado de esta carrera, si es que requiere la identificación y caracterización adecuada de un problema no trivial, la formulación de una metodología o un plan de trabajo para realizar la labor, la búsqueda y revisión del estado del arte, la investigación y comparación de posibles enfoques para abordar el problema, la elección de un enfoque novedoso para resolver el problema, el seguimiento del enfoque según la metodología o el plan de trabajo previamente definido, y la validación del enfoque en términos de cuán bien resuelve el problema identificado. Además, el informe final de la memoria debe ejemplificar, en términos de su estructura y redacción, el estándar esperado de un egresado. Asimismo, la defensa debe ejemplificar el estándar esperado de un egresado en términos de la claridad de la comunicación del trabajo realizado.
El trabajo también puede involucrar una combinación de ingeniería, ciencia y/o matemática.
El trabajo de memoria tiene que ser validado con respecto a cuán bien resuelve el problema identificado; no es necesario que el trabajo resuelva el problema (si es que se cumple con los otros requisitos de la memoria), sin embargo se requiere que se reconozcan las fortalezas y debilidades del enfoque seguido, y las posibles alternativas que existen para mejorar el trabajo en el futuro.
Temas
!!Este wiki esta reemplazado por https://servicios.dcc.uchile.cl/ desde Agosto 2022!!
Aquí a continuación se describirán -de forma breve-, algunos temas de memoria disponibles en este momento con el contacto del profesor guía responsable. Esta lista no es exhaustiva: puede ser que los profesores elegibles tengan temas no enumerados aquí, en cuyo caso, habrá que comunicarse directamente con los profesores. Además, un alumno puede proponer su propio tema y encontrar un profesor para guiar el trabajo. En general, se presentan los últimos temas agregados primero, pero puede haber temas nuevos al fin también. Algunos temas pueden ser extendidos para hacer una doble titulación de magister; se destacan esos temas con la etiqueta (Memoria o Doble Titulación).
- Objetivo: Generación de dataset sintético para evaluación de algoritmos de detección de simetrías en 3D
- Profesor Guía: Ivan Sipiran
- Descripción: (Memoria o Doble Titulacion): Existen muchos algoritmos que permiten detectar la estructura simétrica de un objeto 3D. Este tipo de algoritmo son importantes para tareas de alto nivel en visión computacional como detección de objetos, reconstrucción de escenas, etc. Sin embargo, no existe una forma estándar para evaluar qué tan buenos son estos algoritmos en condiciones específicas. Generalmente, la metodología de evaluación emplea unos pocos objetos elegidos de manera subjetiva, por lo que no es posible comparar dos algoritmos para la misma tarea. Este trabajo busca proponer una metodología de bechmarking que sea lo más general posible. Un punto de partida es este artículo (https://www.sciencedirect.com/science/article/pii/S0097849322001224) que realiza el benchmarking de algoritmos de detección de primitivas geométricas. La idea es proponer e implementar una metodología similar para la tarea de detección de simetrías 3D.
- Objetivo: Self-supervised learning sobre representaciones 3D
- Profesor Guía: Ivan Sipiran
- Profesor Co-guía: José Manuel Saavedra
- Descripción: (Memoria o Doble Titulacion): La tendencia actual para aprender representaciones profundas de datos es realizar el entrenamiento sin supervisión y dejar que una red neuronal aprenda la mejor forma de representar los datos y sus variaciones. Actualmente existen modelos como BYOL o SimSiam que han probado ser muy efectivos para tareas sobre imágenes. Sin embargo, no existe ningún trabajo actual que busque replicar esa efectividad sobre datos 3D. Este es un trabajo experimental, en donde buscamos que se apliquen modelos como BYOL (https://papers.nips.cc/paper/2020/file/f3ada80d5c4ee70142b17b8192b2958e-Paper.pdf) o SimSiam (https://github.com/facebookresearch/simsiam) a representaciones 3D y evaluar su efectividad en tareas downstream como clasificación y retrieval.
- Objetivo: Reingeniería del Portal de Proyecto de Software (portalpsw.dcc.uchile.cl)
- Profesor Guía: Cecilia Bastarrica
- Descripción: (Memoria): A lo largo de muchos años, varios equipos del curso Ingeniería de Software II han desarrollado incrementalmente el portal de postulación, administración y gestión económica del curso Proyecto de Software. Este portal ha sido fundamental para difundir el trabajo realizado por alumnos de último año, mostrar qué pueden hacer nuestros egresados y lograr una vinculación tangible con el medio externo. Sin embargo, y como consecuencia de su génesis, ha crecido de forma poco armónica en muchos sentidos provocando sucesivas etapas de erosión del diseño arquitectónico. Por ejemplo, el modelo de datos no responde a las necesidades del portal como un todo, sino que ha sido extendido de acuerdo con las necesidades particulares. Tampoco el diseño gráfico es consistente, tanto en su jerga como en sus colores y simbología. Como consecuencia de esta erosión también se ha introducido una serie de errores que ya cuesta cada vez más corregir además de cierta funcionalidad que jamás se ha usado. Como parte de este trabajo de título se propone hacer una evaluación del portal de Proyecto de Software y una reingeniería de tal modo de lograr un diseño robusto, extensible y consistente para todas sus facetas.
- Objetivo: Desarrollar una herramienta de visualización interactiva para caracterizar la calidad nutricional de los restaurantes.
- Profesor Guía: Andrés Abeliuk / Abigail Horn (USC)
- Descripción (Memoria): Este proyecto reúne a un equipo interdisciplinario con experiencia en salud pública, nutrición, ciencia de datos y procesamiento de lenguaje natural/ML. El proyecto propuesto se basa en un trabajo preliminar para usar datos de menús digitales a gran escala y un algoritmo para estimar la composición nutricional de los elementos del menú y usar esta información para calcular un indicador continuo de la calidad nutricional de un restaurante (A continuous indicator of food environment nutritional quality). Nuestros indicadores de Calidad Nutricional de Restaurantes fueron incluidos en el Building H Index, un ranking de cómo los productos de las principales compañías de Estados Unidos dañan versus promueven la salud humana. El objetivo de esta memoria es crear una plataforma para mostrar los datos, y métricas obtenidas de nuestro indicador nutricional. Esto incluirá una herramienta de visualización interactiva basada en mapas para explorar la calidad nutricional de los puntos de venta de alimentos en Los Ángeles, California, y métricas y gráficos interactivos para comparar restaurantes entre vecindarios. El sitio web también brindará acceso a los puntajes calculados de la calidad nutricional de cada outlet, permitiendo su uso en otros proyectos de investigación en salud nutricional.
- Objetivo: Desarrollar plug-in para segmentación celular
- Profesor Guía: Mauricio Cerda / Jorge Jara
- Descripción (Memoria): Nuestro grupo ha desarrollado y publicado (https://doi.org/10.1111/jmi.12887) algoritmos para segmentar membranas celulares y estructuras afines en imágenes de microscopía, en función de la intensidad de señal y restricciones geométricas (ver ejemplo en figura). Buscamos generar una implementación portable y/o escalable de estos algoritmos para su distribución y uso modular en software de análisis científico de imágenes (ImageJ, Icy u otro) con usuarios no especialistas. El trabajo se realizará en el contexto de un proyecto de investigación FONDECYT que apoyará financieramente al estudiante. La mayor parte del proyecto se realizará en el laboratorio de análisis de imágenes científicas SCIAN-Lab (www.scian.cl) de la Facultad de Medicina de la Universidad de Chile. Dependiendo del contexto se considerará su realización a distancia. [Disponible 2022-04-08].
- Objetivo: Conectando BibKG con Wikidata
- Profesor Guía: Aidan Hogan
- Descripción: BibKG es una nueva iniciativa del Instituto Milenio Fundamentos de los Datos (IMFD) que pretende generar un grafo de conocimiento abierto sobre publicaciones académicas. En este momento, tiene guardado información sobre publicaciones en el área de computación integrada de dos fuentes: DBLP y ArnetMiner. Ahora queremos integrar una tercera fuente – Wikidata – que es un grafo de conocimiento mucho más general. En el caso de algunas entidades en BibKG, ya tenemos enlaces a entidades en Wikidata (por ejemplo, yo). En otros casos, no tenemos enlaces. El objetivo de este tema de memoria es fortalecer la conexión entre BibKG y Wikidata, enlazando más entidades. Empezaremos con las publicaciones, haciendo match en las llaves disponibles en ambos grafos (ISBN, DOI, DBLP id, ArnetMiner id), y luego, basado en las coincidencias nuevas, haremos match de los autores, y las afiliaciones. El resultado de este trabajo nos permitiría enriquecer los datos de BibKG con información de Wikidata. [No tengo más cupos para el semestre 'F' de Primavera 2022]
- Objetivo: Generación de diagramas de secuencia a partir de código en Python
- Profesor Guía: Jocelyn Simmonds (jsimmond@dcc.uchile.cl)
- Descripción: (Memoria o Doble Titulación) Esta memoria/tesis busca extender alguna herramienta que genere diagramas de UML a partir de código en Python, para poder generar diagramas de secuencia que permitan visualizar la interacción entre objetos. En particular, me interesa generar diagramas de secuencia a partir de proyectos de Django, para buscar patrones y anti-patrones de desarrollo. Pueden encontrar una lista actualizada de herramientas de UML para Python en el siguiente link: https://modeling-languages.com/uml-tools/#python (la mayoría genera diagramas de clase, algunos también generan diagramas de paquete, y solo uno hace diagramas de objeto).
- Objetivo: Sistema de apoyo para la Mesa de Genero DCC
- Profesor Guía: Jocelyn Simmonds (jsimmond@dcc.uchile.cl)
- Descripción: (Memoria) A fines de 2021 empezó a funcionar la Mesa de Género del DCC, y la primera tarea que se le encomendó a esta mesa fue hacer un diagnostico de la situación de los distintos estamentos del departamento, con perspectiva de género. Como parte de este trabajo, analizamos datos de diversas fuentes de información (como U-Cursos/Ucampus y encuestas realizadas a la comunidad), y estamos en el proceso de generar un informe para la comunidad. Esta memoria busca generar un sistema de apoyo para la Mesa de Género, ayudando a definir estas métricas e indicadores, y generandolas a partir de información sacada de diversos sistemas.
- Objetivo: Estudio del efecto de los memes en la polarización en redes sociales
- Profesor Guía: Benjamin Bustos (bebustos@dcc.uchile.cl)
- Descripción: (Memoria o Doble Titulación) Esta memoria/tesis se enmarca dentro de un área de investigación que desarrollamos en el Instituto Milenio Fundamentos de los Datos (IMFD). En particular, estamos estudiando el potencial efecto de los memes en la polarización del discurso en redes sociales. Este trabajo es de corte interdisciplinario y contará con la participación de investigadoras(es) del IMFD.
- Objetivo: Herramienta para realizar revisiones sistemáticas de la literatura
- Profesor Guía: Cecilia Bastarrica (cecilia@dcc.uchile.cl);
- Descripción: (Memoria o Doble Titulación): Las revisiones sistemáticas de la literatura (SLR) son una forma de recopilación de información de un área de conocimiento acotada a fin de lograr una visión global de la investigación previamente realizada. Las tres grandes dificultades de realizar una SLR son: la recopilación de trabajos, su selección y su análisis. Este tema de memoria apunta a abordar el primer punto. En general, en ciencias de la computación, existen tres o cuatro bibliotecas digitales generalmente usadas como fuente (IEEE, ACM, Springer), no todas ellas con igual forma de acceso y búsqueda. La mayor parte de las publicaciones de estas bibliotecas pueden accederse a través de DBLP, aunque no absolutamente todas pero con la ventaja de que tienen un único mecanismo de acceso. El objetivo de esta memoria es construir una herramienta que, dado un string de búsqueda, sea capaz de buscar en DBLP las publicaciones referentes al área. Existe un trabajo previo muy básico que podría usarse como una primera versión o solamente como referencia. (https://repositorio.uchile.cl/handle/2250/170457)
- Objetivo: Optimizing interactions between humans and models in hybrid forecasting
- Profesor Guía: Andrés Abeliuk (aabeliuk@dcc.uchile.cl); Daniel Benjamin (Decision Sciences)
- Descripción: (Memoria o Doble Titulación): Accurate prediction of geopolitical outcomes is vital for evidence-based decision making. Crowdsourcing human forecasts and machine learning models each increase accuracy and reliability of predictions, however, neither method is consistently superior to the other. Hybrid forecasting – pairing human forecasters with machine models – improves predictions by capitalizing on the unique advantages of each method. Our results show that the strengths of machine models and crowdsourced predictions can be simultaneously leveraged to improve accuracy, but distrust and confirmation bias impede performance (Quantifying machine influence over human forecasters). The objective of this research is to compare prediction by statistical models and humans under different conditions (e.g. if contextual framing affects accuracy) and develop better hybrid forecasting systems.
- Objetivo: Elastic-TCP: evaluando conexiones de Chile al mundo
- Profesor Guía: Jo Piquer
- Descripción: El año 2019 se publicó una nueva propuesta de algoritmo de manejo de ventana de transmisión para TCP, llamado Elastic-TCPhttps://ieeexplore.ieee.org/abstract/document/8642512/, con su implementación para Linux. Esta propuesta parece perfecta para resolver el problema que tiene Chile en sus conexiones internacionales, superando el clásico problema del Round-trip time alto con anchos de banda altos, que vuelven muy ineficientes las implementaciones clásicas de TCP. Esta memoria busca evaluar en la práctica las ganancias y comparaciones de esta solución con las alternativas, generando recomendaciones concretas de configuración para los sistemas que requieren transferencias TCP de archivos grandes internacionales (como los astrónomos). [Ultima Modificación: [2021-09-09]]
- Objectivo: Implementar y evaluar tokenizadores basados en gramáticas para NLP.
- Profesores Guia: Felipe Bravo y Gonzalo Navarro
- Descripcion: Memoria Los modelos de lenguaje modernos tipo BERT se basan en tokenizadores de sub-palabras de tipo Byte-Pair Encoding y WordPiece tokenization. No hay evidencia de estudios que comparen métodos basados en gramáticas como Re-Pair para la creación de este tipo de modelos. En la memoria se van a implementar estos tokenizadores y comparar con los existentes en diversas tareas de NLP. Referencias: https://towardsdatascience.com/byte-pair-encoding-subword-based-tokenization-algorithm-77828a70bee0 y Capítulo 4 de: https://minerva-access.unimelb.edu.au/bitstream/handle/11343/38920/66117_00000871_01_wan_phd.pdf?sequence=1.
- Conocimientos deseables: diseño y análisis de algoritmos y NLP.
- Objetivo: Desarrollo de nuevas funcionalidades para la aplicación Relief Creator: visualización, creación y modificación de mapas paleogeográficos. Entre ellas: Generación de paleobatimetrías (paleoelevaciones) a partir de curvas de nivel y Generación de relieve usando geometría fractal.
- Profesor Guía: Fernando Poblete (ferpoble@uchile.cl), Nancy Hitschfeld (nancy@dcc.uchile.cl)
- Descripción: Los mapas paleogeográficos nos muestran cómo era la tierra en diferentes períodos geológicos y constituyen herramientas esenciales para entender la dinámica del sistema terrestre. Los mapas son las condiciones de borde necesarias para analizar procesos superficiales, interacción de la biota y para modelar el clima y la geodinámica terrestre, entre otros. Uno de los períodos más enigmáticos en la evolución terrestre es entre el Neoproterozoico tardío y el Cámbrico (720-500 Ma aprox) cuando la tierra estuvo completamente cubierta de hielo para después dar paso a la Explosión Cámbrica, momento en que la vida comienza a florecer. El proyecto INACH RT_44-18, donde se enmarca esta práctica, tiene como objetivo constreñir la evolución paleogeográfica de las Montañas Ellsworth, Antártica, entre el Neoproterozoico tardío y el Cámbrico Inferior y comprender posibles relaciones temporales entre paleoclima, paleogeografía y evolución de la vida. En el marco de este proyecto, un ex estudiante del DCC hizo su memoria con nosotros y que consistió en el desarrollo de un programa que permita la visualización, creación y modificación de mapas paleogeográficos a partir de una topografía. El programa permite modificar la topografía actual usando una relación lineal entre las alturas iniciales y finales en una región dada. En esta memoria se busca agregar nuevas funciones para la generación de relieve mediante el uso de un enfoque fractal y por curvas de nivel.
- Objetivo: Desarrollo de una versión WEB del software Relief Creator: visualización, creación y modificación de mapas paleogeográficos.
- Profesor Guía: Fernando Poblete (ferpoble@uchile.cl), Nancy Hitschfeld (nancy@dcc.uchile.cl)
- Descripción: Los mapas paleogeográficos nos muestran cómo era la tierra en diferentes períodos geológicos y constituyen herramientas esenciales para entender la dinámica del sistema terrestre. Los mapas son las condiciones de borde necesarias para analizar procesos superficiales, interacción de la biota y para modelar el clima y la geodinámica terrestre, entre otros. Uno de los períodos más enigmáticos en la evolución terrestre es entre el Neoproterozoico tardío y el Cámbrico (720-500 Ma aprox) cuando la tierra estuvo completamente cubierta de hielo para después dar paso a la Explosión Cámbrica, momento en que la vida comienza a florecer. El proyecto INACH RT_44-18, donde se enmarca esta práctica, tiene como objetivo constreñir la evolución paleogeográfica de las Montañas Ellsworth, Antártica, entre el Neoproterozoico tardío y el Cámbrico Inferior y comprender posibles relaciones temporales entre paleoclima, paleogeografía y evolución de la vida. En el marco de este proyecto, un ex estudiante del DCC hizo su memoria con nosotros y que consistió en el desarrollo de un programa que permita la visualización, creación y modificación de mapas paleogeográficos a partir de una topografía. Una versión web del programa permitirá masificar su uso en la comunidad de geocientíficos, y servir como herramienta para la enseñanza de la evolución del paisaje en educación primaria y secundaria.
- Objetivo: Desarrollo de nuevas funcionalidades para la aplicación Relief Creator: visualización, creación y modificación de mapas paleogeográficos. Entre ellas: Agregar un “undo” a las transformaciones y Agregar una consola que permita agregar scripts realizados por el usuario para la modificación del relieve.
- Profesor Guía: Fernando Poblete (ferpoble@uchile.cl), Nancy Hitschfeld (nancy@dcc.uchile.cl)
- Descripción: Los mapas paleogeográficos nos muestran cómo era la tierra en diferentes períodos geológicos y constituyen herramientas esenciales para entender la dinámica del sistema terrestre. Los mapas son las condiciones de borde necesarias para analizar procesos superficiales, interacción de la biota y para modelar el clima y la geodinámica terrestre, entre otros. Uno de los períodos más enigmáticos en la evolución terrestre es entre el Neoproterozoico tardío y el Cámbrico (720-500 Ma aprox) cuando la tierra estuvo completamente cubierta de hielo para después dar paso a la Explosión Cámbrica, momento en que la vida comienza a florecer. El proyecto INACH RT_44-18, donde se enmarca esta práctica, tiene como objetivo constreñir la evolución paleogeográfica de las Montañas Ellsworth, Antártica, entre el Neoproterozoico tardío y el Cámbrico Inferior y comprender posibles relaciones temporales entre paleoclima, paleogeografía y evolución de la vida. En el marco de este proyecto, un ex estudiante del DCC hizo su memoria con nosotros y que consistió en el desarrollo de un programa que permita la visualización, creación y modificación de mapas paleogeográficos a partir de una topografía. Actualmente queremos agregar nuevas funcionalidades que permitan robustecer el programa.
- Objetivo: Mallas poligonales de superficie
- Profesor Guía: Nancy Hitschfeld y Sergio Salinas (nancy@dcc.uchile.cl)
- Descripción: Expansión de mallas poligonales 2d a superficies: Se requiere independizar la manera en que el algoritmo recibe el input y que sea compatible con la estructura de datos con la que se manejan los triángulos para generar los polígonos de la malla final. Actualmente el algoritmo está limitado a trabajar PLSG (Planar straight-line graph) en 2D. De igual forma, no hay limitaciones teóricas para expandir el algoritmo a superficies de figuras 3D. Para ello, se requiere cambiar la forma en que algoritmo maneja los archivos de input y la generación de la estructura de datos. Actualmente. para ambos puntos, el algoritmo utiliza la librería Detri2 [1] para leer el PLSG en formato .poly o .node y .ele, y rellenar, tres arreglos, uno de vértices, uno de triángulos y uno con las adyacencias de los triángulos. Los últimos dos son independientes de la dimensión en que se trabaje el arreglo de vértices (este solo se usa para calcular el largo de las aristas), pero deben respetar un orden interno para el correcto funcionamiento del algoritmo.
- Objetivo: Refinamiento mallas poligonales por arista
- Profesor Guía: Nancy Hitschfeld y Sergio Salinas (nancy@dcc.uchile.cl)
- Descripción: Las aplicaciones tradicionales, generación de terrenos, computer vision, FEM, geología, etc., en las que se usan mallas de poligonos por lo general solo admiten mallas con poligonos convexos, por lo que las mallas Polylla quedan inutiliadas en esas aplicaciones. El mallador polylla tiene input una triangulación inicial, a la que se eliminar aristas para generar una malla polylla, estas aristas eliminadas se conservan en la implementación [11], como trabajo de investigación, nos gustaría extender el algoritmo en [11] para utilizar esas aristas eliminadas y utilizarlas para generar mallas de poligonos que tengan solo poligonos convexos. Una vez generadas estas mallas, compararlas con las mallas Polylla tradicionales bajo diferentes metricas, como angulo minimo, cantidad de poligonos, arista minima, etc. Como trabajo extra y opcional, verificar como estas mallas Polylla convexas funcionan en uno de los campos tradicionales de las mallas poligonales. La implementación de [11] tiene un método para insertar aristas eliminadas de la triangulación, por lo que habría que adaptarlo para usarlo para este proposito.
- Objetivo: Refinamiento mallas poligonales por insercion de puntos
- Profesor Guía: Nancy Hitschfeld y Sergio Salinas (nancy@dcc.uchile.cl)
- Descripción: El concepto de Terminal-region fue planeado originalmente para ser usado por el algoritmo Lepp para refinar mallas de poligonos. Actualmente hay dos tipos de refinamiento por Lepp ampliamente conocidos, Lepp centroid Delaunay algorithm [15], que se basada en la insercción de punto en el centroide del Lepp, y Lepp bisection algorithm [a], que se basa en insertar un punto en mitad de una terminal-edge. Como trabajo investigativo nos gustaría extender el mallador Polylla para implementar una o ambas inserciones de puntos en [11], esto con el objetivo de tener un refinador, ya sea uno adaptativo, que dado un polígono de Polylla lo refina o uno que refina toda la malla Polylla. La estructura de datos half-edge usada en [11] no tiene el método de inserción de puntos, por lo que habría que implementarlo.
- Objetivo: Representacion de imagenes con mallas
- Profesor Guía: Nancy Hitschfeld y Sergio Salinas (nancy@dcc.uchile.cl)
- Descripción: Arte Poylla: Una de las aplicaciones de las triangulaciones de Delaunay y Diagrama de Voronoi es para representar imágenes con triángulos y polígonos de Voronoi, a está técnica se le llama image triangulation, un ejemplo de una investigación basado en esto puede ser visto en [17], un software conocido para ello es Triangula [18]. Ambos trabajos se basan en buscar una forma de insertar la mínima puntos en una imagen, de tal manera que los elementos de esta no pierdan su forma y puedan ser aún reconocidas después de triangulizar la imagen (el color de cada triángulo se calcula como el promedio de los valores RGB que tienen los píxeles donde se insertaron esos puntos). El trabajo de investigación trataría de lo mismo, buscar una forma de insertar puntos en una imagen, de tal manera que al aplicar el mallador Polylla sobre tales puntos e insertar los polígonos en la imagen, sigan siendo reconocibles los elementos de la imagen. Una primera prueba de esto ya se ha intentado mediante la inserción de puntos aleatorios sobre una imagen (ver imagen adjunta de la Dr.a Nancy Hitschfeld) y mediante la inserción de puntos en las partes con más sombras (ver retrato con fondo blanco). Se tienen los scripts necesarios para Polyllanizar las imagenes dando un conjunto de puntos, pero más investigación sobre el estado del arte es necesaria para lograr que los elementos de la imagen no pierdan su figura insertando la mínima cantidad de puntos posibles.
- Objetivo: Plataforma web de generación de mallas
- Profesor Guía: Nancy Hitschfeld y Sergio Salinas (nancy@dcc.uchile.cl)
- Descripción: Otra alternativa para facilitar el uso de estas mallas en otras áreas es por medio de una plataforma web. Esta plataforma recibiría los puntos iniciales, o el PLSG, como archivo de texto, y generaría una malla Polylla visualizable y descargable. El objetivo de esta plataforma es, no solo generar mallas terminales, sino que también servir como demostración de los distintos generadores de mallas que han creado durante el DCC. Por lo que se debería pensar a futuro como un software al que se le van a ir agregando más generadores a futuro y ser escrito con frameworks web que aseguren su mantención para futuros tesistas del DCC. Esta plataforma también debe contar con una API privada que maneje el dcc, de tal manera de dar completo acceso a la plataforma a la gente que desee trabajar con ellas y poder integrarla internamente a los scripts de sus programas.
- Objetivo: Sistema de gestión de vida del colaborador
- Profesor Guía: Adolfo Carrasco (adolfo.carrasco@uchile.cl)
- Descripción: Se requiere el diseño de una solución que pueda manejar el ciclo de vida de un colaborador (reclutamiento, selección, contratación, actuaciones sobre un colaborador y desvinculación), manejando información anexa tal como certificaciones, CV, etc, permitiendo que distintos usuarios internos colaboren con información que aporte a conocer la vida y desempeño del colaborador y, finalmente, emitir informes unitarios o agregados que sean útiles para el pago de remuneraciones y para gestión posterior. La implementación posterior debe ser indicada a nivel de recomendaciones de arquitectura y datos, pero sí se debe entregar un primer nivel de interacción con los usuarios a través de mockups.
- Objetivo: Sistema de planificación y gestión de turnos
- Profesor Guía: Adolfo Carrasco (adolfo.carrasco@uchile.cl)
- Descripción: Se requiere el diseño de una solución que pueda manejar la planificación de turnos de cuidado de pacientes, respetando los marcos legales de horas mensuales de trabajo y los tiempos libres mínimos de fines de semana. En la parte de gestión se debe contrastar lo planificado con la realidad de los turnos efectivamente realizados y proponer alternativas de colaboradores que puedan en determinado momento puedan realizar turnos extra en pacientes que quedan sin cuidado. . También se debe poder emitir informes unitarios o agregados que sean útiles para gestión posterior y vaciar información hacia los sistemas de remuneraciones de la empresa. La implementación posterior debe ser indicada a nivel de recomendaciones de arquitectura y datos, pero sí se debe entregar un primer nivel de interacción con los usuarios a través de mockups.
- Objetivo: Sistema de reclutamiento y selección de colaboradores
- Profesor Guía: Adolfo Carrasco (adolfo.carrasco@uchile.cl)
- Descripción: Se requiere el diseño y construcción de una solución que pueda manejar el ciclo de reclutamiento y selección de colaboradores, almacenando información anexa tal como certificaciones, CV, etc, permitiendo que distintos usuarios internos colaboren con información resultante de entrevistas técnicas y que finalmente entregue la información necesaria a incluir en los sistemas de personal y remuneraciones de la empresa, acompañado de la documentación que constituye la “carpeta del colaborador”. Debe entregar informes unitarios o agregados que sean útiles para gestión posterior.
- Objetivo: Cómo la influencia social puede mejorar la inteligencia colectiva
- Profesor Guía: Andrés Abeliuk (aabeliuk@dcc.uchile.cl)
- Descripción: (Memoria o Doble Titulación): La “sabiduría de los grupos” (“wisdom of the crowds”) describe el fenómeno de que la inteligencia colectiva de una multitud es capaz de producir mejores resultados que un pequeño grupo de expertos. Esto es resultado de que al agregar las respuestas de varias personas, si sus errores son independientes, se anulan entre sí, lo que da lugar a una estimación más precisa. Lo paradójico de este fenómeno, es que para que el grupo se comporte de manera inteligente, los individuos tienen que ser independientes y diversos (How social influence can undermine the wisdom of crowd effect). Sin embargo, el mundo está cada vez más interconectado, produciendo que los errores/sesgos esten correlacionados. Esta investigación busca encontrar las condiciones necesarias para que la influencia social sea beneficiosa en sistemas sociotécnicos, usando modelamiento matemático, simulaciones y experimentos en línea.
- Objetivo: Cuantificando la complejidad de las opiniones y los debates usando NLP
- Profesor Guía: Andrés Abeliuk (aabeliuk@dcc.uchile.cl)
- Descripción: (Memoria o Doble Titulación): La mayor parte de los trabajos teóricos y empíricos reducen las opiniones a un número real. Mientras que un espacio unidimensional de opiniones puede ser suficiente para caracterizar en grandes rasgos a las personas en dos grupos, por ejemplo, izquierda vs derecha o liberales vs conservadores, pueden carecer de una representación más precisa y matizada de las opiniones complejas y multilaterales en una discusión. La complejidad puede aproximarse como el número de dimensiones latentes que mejor representan las opiniones de las personas, medidos por sus patrones de votación (On the Complexity of Opinions and Online Discussions). Esta investigación busca desarrollar herramientas de NLP para medir la complejidad de las discusiones en circunstancias que no hay votos explícitos y sólo se observan las discusiónes en lenguaje natural. Ejemplos de aplicación son las noticias, redes sociales, registros del congreso/constituyentes, etc.
- Objetivo: Diseño y evaluación de procesos híbridos de desarrollo de software
- Profesor Guía: Cecilia Bastarrica: cecilia@dcc.uchile.cl
- Descripción: Un proceso híbrido es uno que combina prácticas ágiles y otras tradicionales. Esta es el enfoque más habitual en las empresas de desarrollo de software. Sin embargo, no siempre es claro cuál es una combinación apropiada ni cuáles tareas es conveniente abordar con uno u otro enfoque. Es más, una combinación de prácticas puede ser apropiada para alguna característica como el time-to-maket de un proyecto mientras que en otros casos sea prioritaria la calidad del software producido. En ambos casos la combinación de prácticas más apropiadas será distinta. Como parte de una investigación hemos diseñado DynaTail (https://www.dcc.uchile.cl/TR/2021/TR_DCC-20210518-001.pdf), un mecanismo para configurar automáticamente las prácticas un proceso de software de acuerdo con las características deseadas. En esta memoria se busca construir una herramienta gráfica que permita la interacción directa con el proceso y el cálculo automático de los valores de la característica deseada.
- Objetivo: Desempeño de mujeres en el desarrollo de software
- Profesor Guía: Cecilia Bastarrica: cecilia@dcc.uchile.cl
- Descripción: Las mujeres han sido tradicionalmente una minoría dentro del desarrollo de software. Esto ha sido así también la realidad dentro del DCC. La FCFM ha impulsado el ingreso de mujeres, aunque su porcentaje dentro del DCC ha permanecido prácticamente igual. Existen varios estereotipos con frágil sustento que indican que las mujeres tienen un peor desempeño que los hombres en el desarrollo de software, o bien que destacan en facetas particulares no siempre bien valoradas tales como el control de calidad, la gestión de proyectos o la documentación de sistemas. En este trabajo de memoria se busca construir una herramienta que permita analizar el desempeño de las mujeres dentro del DCC. Esto servirá para derribar estereotipos posiblemente falsos y dar apoyo a acciones específicas que promuevan el desempeño de las mujeres y la percepción que se tiene de ello dentro del DCC.
- Objetivo: Herramienta de análisis del trabajo en equipo
- Profesor Guía: Cecilia Bastarrica: cecilia@dcc.uchile.cl
- Descripción: El trabajo en equipo trae consigo beneficios en la realización de prácticamente todos los tipos de proyectos que puedan emprenderse. El desarrollo de software no es una excepción. Más aún, las metodologías ágiles lo promueves especialmente. En los cursos del DCC relacionados con ingeniería de software (Ingeniería de Software I, Ingeniería de Software II y Proyecto de Software) los proyectos se realizan en equipos desde hace muchos años. Existe por lo tanto una enorme cantidad de datos relativos al desempeño de dichos proyectos desde distintos puntos de vista: calidad del software desarrollado, gestión del proyecto, y trabajo en equipo. En particular, se ha aplicado el mismo instrumento para coevaluación por largo tiempo, lo que permitiría analizar la calidad del trabajo en equipo a través de los años o bien comparar la calidad del trabajo en equipo desde distintos puntos de vista entre los cursos. En este trabajo se busca construir una herramienta que implemente esta funcionalidad filtrando la información a comparar y que permita graficar estos valores. Esta herramienta será de gran utilidad para la mejora continua de la forma en que se aborda la docencia en estos cursos, así como para hacer investigación en el área.
- Objetivo: Exploración de Mecanismos de Interacción en Realidad Virtual para el Manejo de Lenguajes de Programación Basados en Bloques
- Profesor Guía: Francisco J. Gutiérrez: frgutier@dcc.uchile.cl
- Descripción: (Memoria o Doble Titulación) Hoy en día, somos testigos de un auge en la exploración de nuevas formas para desarrollar el pensamiento computacional en niñas y niños. Tradicionalmente, el mecanismo preferido para acercar a los jóvenes a la programación, sobre todo a aquellos/as en edades tempranas (10-12 años), es a través de lenguajes de programación basados en bloques, como Scratch, Blockly, Snap! o App Inventor. La mayoría de estos lenguajes, si es que no todos, se basan en un paradigma de interacción tradicional de tipo point-and-click y escribiendo comandos e instrucciones con un teclado. Dado el avance en la adopción de mecanismos alternativos de interacción, como lo son las interfaces controladas por gestos, en un trabajo previo con estudiantes del DCC desarrollamos Gesture Coding, un entorno de programación basado en bloques controlado únicamente por Joy-Cons de Nintendo Switch. En nuestros primeros experimentos pilotos con usuarios reales, hemos obtenido resultados muy satisfactorios en términos de usabilidad, utilidad percibida y adopción temprana del paradigma de interacción, como un mecanismo no-convencional para introducir a poblaciones jóvenes al uso e interacción con lenguajes de programación basados en bloques. Siguiendo esta inspiración, en este proyecto de título o tesis de Magister se busca explorar cómo definir metáforas de interacción simples y fácilmente adoptables, así como identificar los desafíos que presentaría el diseñar un prototipo de entorno de programación basado en bloques, controlado en un entorno de realidad virtual. Como tecnología de apoyo, se cuenta con un Headset Oculus Quest, el cual expone un SDK para el desarrollo de aplicaciones integrado a Unity. En una primera aproximación al problema, se propone restringir el dominio de estudio a cuatro componentes: (1) instrucciones de secuencialidad, (2) de bifurcación (if-else), (3) de repetición (while) y (4) manejo de variables.
- Objetivo: Nuevas heurísticas para el diseño estratégico de una red de líneas de Transporte Público
- Profesores Guías: Sergio Jara Díaz (jaradiaz@ing.uchile.cl), Andrés Fielbaum (a.s.fielbaumschnitzler@tudelft.nl)
- Profesor Co-guía: Por definir (del DCC)
- Descripción: (Memoria) El diseño estratégico de una red de líneas de Transporte Público (TP) consiste en encontrar un conjunto de líneas, cada una con su frecuencia y tamaño de vehículos, que puedan servir una matriz de flujos origen-destino optimizando una función objetivo que considere todos los recursos económicos necesarios, tanto los de operación como el tiempo de los usuarios. Siendo un problema NP-duro, en redes reales se usan heurísticas, gran parte de las cuales comienzan con líneas directas entre todos los pares origen-destino (con gran beneficio para los usuarios), para luego re-diseñar iterativamente los recorridos, haciéndolos más largos para tomar más pasajeros y así reducir el número de líneas, disminuyendo el costo de operación hasta llegar a un estado aceptable. En esta tesis se propone generar nuevas heurísticas usando un modelo existente de ciudad que se basa en la estructura de centros y la red vial primaria que los sirve, con una estructura de demanda por viajes que refleja - mediante pocos parámetros - la distribución de los mismos entre esos centros. Esta Ciudad Paramétrica es la base para construir una heurística que identifique trazados iniciales razonables de TP (como hub-and-spoke, troncal-alimentador, sin trasbordos, expresos), y lo modifique disminuyendo la suma de costos de usuarios y operadores, arribando a una red estratégica de TP con sus respectivas frecuencias y tamaños de vehículo. La bondad de esta(s) nueva(s) heurística(s) deberá ser comparada con aquellas existentes, basadas principalmente en directas. (Ver más detalles.)
- Objetivo: Desarrollo de una plataforma para control de cumplimiento de Sistema General de Seguridad de Información (SGSI)
- Profesor Guía: Eduardo Godoy Vega (egodoy@dcc.uchile.cl)
- Descripción: (Memoria) La norma ISO27001 es uno de los tantos frameworks para el desarrollo de políticas y procedimientos de Seguridad de la Información; en el caso de ISO27001, son más de 100 controles los que se pueden adoptar, muchos de ellos deben generar en diferentes tiempos los registros de control, los que pueden ser imágenes, documentos, planillas, etc.; los que deben ser revisado en un workflow de aprobación y ser almacenados de forma que garantice el no repudio entre otras características. Se propone el desarrollo de una plataforma (front/back office) que permita la gestión de los registros de control, con panel de cumplimiento, resguardo de los medios de pruebas; debe ser multiplataforma.
- Objetivo: Desarrollo de Edge Gateway para el monitoreo de condiciones industriales
- Profesor Guía: Luciano Radrigan (lucianoradrigan arroba gmail.com)
- Descripción: (Memoria) El estudio del monitoreo de condiciones requiere modelos capaces de diagnosticar y pronosticar fallas producidas por degradación o fallas aleatorias de máquinas críticas. Estos modelos suelen basarse en análisis de mediciones recopilados por sensores interconectados por redes inalámbricas (IIoT). Edge Gateway busca ser una herramienta eficaz para entregar diagnósticos y pronósticos evitando la latencia y disminuyendo los cálculos computacionales que se ejecutarían en un servidor tradicional o Cloud Computing. Se propone entonces diseñar e implementar algoritmos de machine learning basados en redes neuronales recursivas y convolucionales para el diagnóstico y pronósticos de fallas, optimizados para trabajar en una Arquitectura de Hardware Jetson Xavier y con TensorFlow y CUDA.
- Objetivo: Desarrollo de sistema de visualización por computadora para red de sensores basado en Internet Industrial de las Cosas (SV-IIoT)
- Profesor Guía: Luciano Radrigan (lucianoradrigan arroba gmail.com)
- Descripción: (Memoria ) En la industria 4.0 cada día crecen las implementaciones de sistemas de sensorización para la toma de decisiones. Una de las principales barreras de entrada para estas tecnológica en la mediana industria nacional, son los altos costo de productos altamente especializados en un proceso. SV-IIoT busca ser una herramienta eficaz, versátil y universal para la visualización y gestión de activos a través el despliegue de indicadores claves estratégicos. Se propone entonces diseñar e implementar una plataforma web capaz de gestionar conexiones a bases locales SQL y AWS, para el despliegue de información. La plataforma debe ser capaz de tomar datos en brutos y desplegar indicadores definidos por el usuario. Además, el sistema diseñado debe ser compatible para adjuntar e incorporar modelos 2D y 3D (CAD, Step, entre otros).
- Objetivo: Respira Confianza: Desarrollar un sistema de alerta en casos de contaminación extrema.
- Profesor Guía: A encontrar.
- Contacto: respiraconfianza@gmail.com
- Descripción: La zona de sacrificio de Quintero y Puchuncaví presenta constantemente gran cantidad de casos de intoxicación masiva producto de la alta emisión industrial de contaminantes. Por lo anterior, el proyecto Respira Confianza está generando una red de monitoreo ambiental comunitaria de calidad del aire, junto a un sistema de alerta temprana ante índices de contaminación extrema. El diseño de este proyecto se desarrolla en conjunto con las organizaciones sociales de la comunidad afectada y se cuenta con la colaboración de profesionales de diseño industrial, Fablab, Beauchef Proyecta, Fundación Cisne Negro y Centro de Investigación Mario Molina. En este trabajo se propone: Diseñar un sistema de alerta a la comunidad ante índices de contaminación extrema, vía SMS u otro medio. Este tiene por objetivo alarmar masivamente a la comunidad en casos extremos particulares de contaminación.
- Objetivo: Modulo virtual de laboratorios docentes
- Contacto: Felipe Ochoa fochoac@uchile.cl
- Descripción: Uno de los mayores efectos de la actual pandemia ha sido la necesaria adaptación de la tecnología para dar continuidad a los procesos educativos. En este contexto, el complemento educativo dado por experiencias de laboratorio ha sido una parte importante del desarrollo académico, la cual aún tiene pendiente grandes desafíos para complementar el aprendizaje a distancia. La realización de laboratorios es vital para estudiantes de ingenierías como civil, mecánica, materiales, entre otras. En este contexto, esta tesis consiste en el desarrollo de cuatro módulos virtuales para complementar la enseñanza de la ingeniería civil, a través de la realización de módulos de laboratorio virtuales, que permitan el desarrollo de herramientas de apoyo al aprendizaje a distancia a los futuros ingenieros de nuestro país.
- Objetivo: Desarrollar un modelo de pricing dinámico e implementarlo en una etapa temprana, en la industria del hormigón.
- Profesor guía: Mauricio Cerda
- Contacto: mauricio.cerda@melonhormigones.cl
- Descripción: La industria del hormigón históricamente ha funcionado con lógica de negociación individual con cada cliente y una lista única de precios referenciales, lo que produce una alta variabilidad en ellos. El efecto de tener una lista de precios única también ha producido una asociación de costos a la media, para clientes que consumen recursos dispares. Es por ello que requiere un levantamiento del benchmark y el estado del arte en la materia, para empresas B2B, el desarrollo (o una aproximación de él) de un modelo de estimación de precios a la medida del cliente/caso/ancillary y apoyo en la reportabilidad e implementación de los pilotajes. Requisitos: conocimientos de R/Python, nociones comerciales y buen manejo estadístico.
- Objetivo: Desarrollo de una aplicación para visualizar constelaciones según la cosmovisión indígena
- Profesor Guía: Por ser confirmado
- Contacto: edv@uchile.cl
- Descripción: El programa educativo EdV (Escuela de Verano) de la Universidad de Chile busca apoyo para la ejecución de un proyecto interdisciplinario de divulgación. El objetivo de este proyecto es difundir las ciencias astronómicas y rescatar el conocimiento ansestral de nuestros pueblos indígenas sobre el cielo nocturno. A partir de aquello, se propone crear una APP estilo Sky Map(https://play.google.com/store/apps/details?id=com.google.android.stardroid&hl=es_CL, app Open Source) u otras, pero mostrando constelaciones según la cosmovisión indígena además de las tradicionales occidentales. Para la provisión de fondos, EdV postulará al “Fondo para la difusión de la Astronomía ALMA”, el cual tiene fecha de postulación para el 23 de junio del 2020. Además, el proyecto debe ser implementado en máximo 2 años a partir de la recepción de fondos. Para el desarrollo de la APP, EdV está en busca de apoyo del Departamento de Ciencias de la Computación de la FCFM, ya sea a través de una tesis de pregrado o de un/a investigador/a que tenga interés en el tema.
- Objetivo: Representación Compacta de Series de Tiempo Astronómicas
- Profesores-Guía: Por Ser Confirmado (DCC)/Francisco Forster (Astronomía)
- Contacto Francisco Forster (francisco.forster@gmail.com)
- Descripción: Actualmente los catálogos astronómicos contienen miles de millones de objetos. Cada objeto tiene asociada una posición espacial y una serie de tiempo de las mediciones correspondientes, que pueden llegar a los miles de puntos. Proponemos desarrollar una representación compacta de series tiempos astronómicas con el fin de poder realizar consultas sobre todo el conjunto de manera rápida y eficiente en términos de almacenamiento.
- Objetivo: Poblador de terreno tridimensional en base a set de reglas definidas por el usuario
- Profesor Guía: Daniel Calderón (daniel.calderon@dcc.uchile.cl)
- Descripción: El tamaño de los escenarios en videojuegos de mundo abierto es enorme. El trabajo de poblar dichos mapas con distintos tipos de vegetación, animales, edificios, etc. constituye una laboriosa tarea. Para disminuir los costos de este proceso, se han desarrollado las estrategias de generación de mapas por procedimientos (procedural map generation). De esta forma, mapas gigantescos pueden ser poblados automáticamente en base a parámetros y reglas establecidas por un diseñador. Algunos ejemplos de reglas de generación: (1) en base a la humedad y elevación, utilizar distintos tipos de vegetación; (2) ubicar objectos sobre un mapa acorde a una densidad de probabilidad. El propósito de este proyecto es implementar una API multiplataforma en C++20 que permita generar mapas gigantes y almacenarlos en algún formato de modelos 3D estándar para su posterior uso en un videojuego/simulación. Una variación de este proyecto puede generar el mapa directamente en memoria de GPU para su inmediata animación y visualización. Referencia/Motivación: https://www.youtube.com/watch?v=ToCozpl1sYY
- Objetivo: Lighting 2D
- Profesor Guía: Daniel Calderón (daniel.calderon@dcc.uchile.cl)
- Descripción: La película Klaus de Netflix fue nominada a varios premios. En particular destaca el innovador sistema de iluminación aplicado sobre modelos en 2D dimensiones. Existe una amplia variedad de estrategias de iluminación sobre modelos tridimensionales, pero aplicarlos sobre modelos “planos” presenta distintos desafíos. El propósito de este trabajo es replicar el sistema de la película Klaus, pero utilizando shaders en GPU. De esta manera, se dispondrá de información de modelos articulados en 2D, e información adicional que se pudiera requerir, estos modelos deben ser “pintados” en tiempo real por la GPU considerando fuentes de iluminación. Referencia/Motivación: https://www.youtube.com/watch?v=BlU49dJhfcw
- Objetivo: Datasets para Graph Neural Network aplicadas a Ingeniería de Software
- Profesor Guía: Alexandre Bergel (abergel@dcc.uchile.cl)
- Descripción Una Graph Neural Network (GNN) permite definir modelos de Aprendizaje Automático enfocándose en las dependencias entre datos organizados en una red o grafo. Las GNNs son populares en varios dominios, incluyendo social network, sistema de recomendación, y biología, pero su aplicación en Ingeniería de Software no ha sido suficientemente explorada, principalmente por la falta de datasets estándares para su aplicación. Este tema de memoria (o magister) tiene como principal objetivo construir datasets a partir de tareas de aprendizaje asociadas a Ingeniería de Software en donde los datos se organicen naturalmente como grafos. La idea es generar benchmarks y posteriormente probar modelos del estado del arte de GNNs para hacer predicciones en tareas útiles de Ingeniería de Software. El tema se puede ajustar para pre o postgrado según las expectativas del estudiante.
- Objetivo: Predicción de exámenes necesarios para atención inicial de salud.
- Profesor Guía: Jorge Pérez (jorge.perez.rojas@gmail.com)
- Descripción: El proceso de atención de un paciente comienza generalmente con la visita inicial a un médico especialista que le pide exámenes específicos antes de poder darle un diagnóstico certero. Así el diagnóstico final requiere de dos visitas a un especialista. La idea de este proyecto es construir métodos que puedan, dado el diagnóstico inicial de un paciente en forma de texto en lenguaje natural, hacer una recomendación de posibles exámenes necesarios antes de visitar a un especialista. Un método certero para resolver este problema podría tener un impacto considerable sobre todo en el sistema público de atención en salud. Para construir el método se usarán datos históricos de solicitudes de exámenes. El proyecto no solo contempla el diseño y construcción del método si no también la construcción de un conjunto de datos para evaluar la efectividad del método. Requisitos: se recomienda haber cursado uno o más cursos de Minería de Datos o Aprendizaje de Máquinas durante la carrera, idealmente haber cursado CC6204 (Deep Learning). Se necesita trabajar presencialmente en el centro de salud.
- Objetivo: Procesamiento de lenguaje natural para Fact Checking en Chequeado (https://chequeado.com/)
- Profesor Guía: Jorge Pérez (jorge.perez.rojas@gmail.com)
- Profesores co-Guías: Pablo Fernandez, Mariano Falcón, Chequeado Argentina (pmfernandez@chequeado.com, mfalcon@chequeado.com)
- Descripción: Chequeado es un medio digital sin fines de lucro que se dedica a la verificación del discurso público, la lucha contra la desinformación, la promoción del acceso a la información y la apertura de datos. La mayoría de las tareas se resuelven de forma manual, pero se ha ingresado tecnología para automatizar procesos que hagan más eficiente la operación. Chequeado tiene varios problemas desafiantes para trabajos de título. Entre los problemas a resolver y aplicaciones a desarrollar se encuentran: 1) determinar cuándo una frase de un texto libre es una frase susceptible de ser chequeada (problema de clasificación), 2) determinar si una frase política o económica ya ha sido chequeada en el pasado y encontrar la frase anterior (búsqueda por similitud en texto), 3) determinar a qué persona u organización se atribuye una cita específica de un texto (reconocimiento de entidades nombradas, resolución de referencias), 4) automatizar el proceso de chequeo de frases contra bases de datos de indicadores económicos (parsing semántico y traducción a consultas estructuradas). Cada uno de estos problemas puede generar una memoria de título, por lo que hay espacio para varios estudiantes. Requisitos: no es imprescindible, pero se recomienda haber cursado uno o más cursos de Minería de Datos o Aprendizaje de Máquinas durante la carrera. Financiamiento: Existe la posibilidad de financiamiento para el o la estudiante durante la duración del trabajo de memoria.
- Objetivo: Visualización de discursos políticos de presidentes Chilenos.
- Profesor Guía: Jorge Pérez (jorge.perez.rojas@gmail.com)
- Descripción: Crear una visualización que permita explorar las frases de los discursos políticos de los ex presidentes de Chile. La visualización debe considerar aspectos como la temporalidad, el tema, y el contexto de cada frase pronunciada por cada presidente en cuestión. El trabajo requiere por un lado el procesamiento de lenguaje natural con técnicas de redes neuronales modernas, y por otro la creación de la visualización interactiva para explorar.
- Objetivo: Desarrollar un sistema de auto asignación y evaluación de monitores
- Profesor Guía: Tomas Barros (tbarros@gmail.com)
- Descripción: En el proceso de votaciones hay varias tareas de apoyo al votante que son realizadas por “monitores” (problemas para votar, generación de llaves, escrutinios, etc.). Los monitores suelen ser estudiantes que dedican algunas horas a esta labor los cuales son apoyados con varias herramientas de comunicación, coordinación y otras; pero el recruitment, capacitación, asignación, evaluación, pago y seguimiento se realiza manualmente. Este trabajo de memoria busca desarrollar una aplicación Web que permita la autogestión de monitores.
- Objetivo: App de encriptación de votos
- Profesor Guía: Tomas Barros (tbarros@gmail.com)
- Descripción: En nuestro modelo de voto electrónico, la encriptación de cada voto se ejecuta en uno o varios servidores llamados encriptadores. Este trabajo de memoria busca desarrollar una aplicación en reactjs (y una versión para Android y IOs) que permita encriptar los votos localmente antes de enviarlos a la urna. Entre los requisitos, debe incluir pruebas de que los votos fueron encriptados correctamente sin acusar la opción (Zero Knowledge Proof)
- Objetivo: Sistema de planificación y creación de votaciones
- Profesor Guía: Tomas Barros (tbarros@gmail.com)
- Descripción: Cada vez que se plantea una nueva votación en e-voting, se gatilla un protocolo interno manual que involucra varias tareas, entre ellas, crear las carpetas/estructuras en la nube para almacenar la información, recolectar la información (candidatos/padrón), asignación en calendario, disponibilidad de monitores, condiciones especiales (convocatoria, asistencia presencial), verificación del seteo por el cliente, etc. Además se debe administrar la incertidumbre, muchas veces las fechas, padrón o candidatos no están del todo definidos. Este trabajo de memoria busca desarrollar una aplicación Web donde se puedan planificar (con información parcial) las potenciales votaciones y se generen las estructuras, alertas y asignaciones automáticamente.
- Objetivo: Sistema de monitoreo y alerta de elecciones
- Profesor Guía: Tomas Barros (tbarros@gmail.com)
- Descripción: Este trabajo de memoria busca desarrollar un dashboard y sistema de alertas del estado de las votaciones. Esto no solo involucra la información directa y obvia (cuántas están abiertas, cuantos han votado, si algún servidor se ha caído), sino que información anexa como el estado de las próximas elecciones (cuanto avancen tienen en estar listas), monitores de turnos, casos abiertos por resolver de asistencia, etc.
- Objetivo: Sistema de cierre, archivo y almacenaje de las votaciones
- Profesor Guía: Tomas Barros (tbarros@gmail.com)
- Descripción: Este trabajo de memoria busca desarrollar un sistema que permita “archivar” elecciones pasadas, esto involucra la integración de varios sistemas donde se encuentra la huella completa de la elección (sistema propiamente tal, material en drive, registro de soportes, etc.)
- Objetivo: Sistema de administración Interna
- Profesor Guía: Tomas Barros (tbarros@gmail.com)
- Descripción: Tenemos un sistema básico de administración comercial de las elecciones (una vez efectuada la venta), esto incluye administrar el stock y consumo de elecciones, forma de pago y cobranza. El sistema ya es un poco viejo, necesita reescribirse en base a la experiencia ya ganada y agregar nuevas funcionalidades como la administración de comisiones de los vendedores.
- Objetivo: Refactorización de programas probabilísticos en Haskell
- Profesor Guía: Federico Olmedo (folmedo@dcc.uchile.cl)
- Descripción: (Memoria o doble titulación) Haskell permite escribir programas probabilísticos de una manera muy concisa y elegante a través de la mónada de probabilidades. Sin embargo, el problema de la inferencia —calcular la probabilidad de un evento luego de la ejecución de un programa— suele ser computacionalmente costoso debido a que para ello se deben explorar todas las posibles ejecuciones del programa. Una manera de mejorar el proceso de inferencia consiste en determinar las partes del programa que son independientes entre sí, para refactoriarlo y permitir así su inferencia de manera paralela. El objetivo de esta memoria es desarrollar una herramienta que implemente dicha refactorización. Para ello se va a partir del algoritmo presentado en este artículo (video), y se va a modificar para explotar la conmutatividad de la mónada de probabilidades.
- Objetivo: Mejoras y evaluación de una variante del algoritmo de clustering k-means
- Profesor Guía: Federico Olmedo (folmedo@dcc.uchile.cl)
- Profesor Co-Guía: Aidan Hogan: (ahogan@dcc.uchile.cl)
- Descripción: Esta memoria parte del diseño e implementación reciente de una variante del algoritmo de clustering k-means para el apoyo en la analítica de aprendizaje. Las características distinguidas de esta variante es que es diferencialmente privada (protege la privacidad de los participantes del dataset) y soporta datos masivos (estando implementada en Spark). El objetivo de la memoria es mejorar ciertos aspectos de dicha implementación y evaluar el algoritmo. Concretamente, se debe 1) migrar la implementación a la versión v3.0 de Spark (actualmente está implementado en la v2.3) e identificar oportunidades de optimización, en particular, de paralelización y 2) evaluar (y calibrar) el algoritmo sobre conjuntos de datos masivos, dispersos. Para el desarrollo del trabajo se sugiere (fuertemente) haber tomado los cursos de Procesamiento Masivo de Datos y de Minería de Datos.
- Objetivo: Segmentación semántica de objetos
- Profesor Guía: Mauricio Cerda (mauricio.cerda@uchile.cl)
- Descripción (Memoria o doble titulación): Este proyecto busca explorar técnicas de segmentación automática de imágenes que son capaces de reconocer diferentes instancias según su semántica. Por ejemplo, segmentar los autos en un video, pero también identificar cada auto por separado. Se plantea evaluar y comparar algoritmos para realizar esta segmentación semántica. En particular, se plantea estudiar métodos basados en redes convolucionales recursivas, y a métodos probabilísticos de clasificación a nivel de pixel, y evaluarlos en bases de datos estándar de segmentación semántica. El trabajo se realizará en el contexto de un proyecto de investigación (ANILLO ACT192015 / FONDECYT), el cual apoyará financieramente al estudiante. La mayor parte del proyecto se realizará en el laboratorio de procesamiento científico de imágenes (www.scian.cl) de la Facultad de Medicina de la Universidad de Chile, pero dependiendo del contexto se llevará a cabo a distancia. [Disponible 2022-04-08]
- Objetivo: Tracking celular automatizado para microscopía
- Profesor Guía:Mauricio Cerda (mauricio.cerda@uchile.cl)
- Profesor co-Guía: Miguel Concha (mconcha@med.uchile.cl)
- Descripción (Memoria o doble titulación): Este trabajo plantea diseñar un algoritmo de procesamiento automatizado de seguimiento (o tracking) celular en 3D utilizando imágenes de microscopía para núcleo y membrana. Actualmente, los algoritmos de tracking se basan en minimización de una distancia del centroide de cada objeto entre 2 o más tiempos, también pudiendo incluir otras características tales como área, o forma. En imágenes de microscopía se cuenta con el núcleo celular, pero también con una marca independiente para la membrana, pudiendo potencialmente mejorar el tracking, idea que motiva este proyecto. El trabajo se realizará en el contexto de un proyecto de investigación (ANILLO ACT192015 / FONDECYT), el cual apoyará financieramente al estudiante. La mayor parte del proyecto se realizará en el laboratorio de procesamiento científico de imágenes (www.scian.cl) de la Facultad de Medicina de la Universidad de Chile, pero dependiendo del contexto se llevará a cabo a distancia. [Disponible 2022-04-08]
- Objetivo: Realidad virtual en una Aplicación de Geocolaboración
- Profesores Guías: José A. Pino (jpino@dcc.uchile.cl), Nelson Baloian (nbaloian@dcc.uchile.cl)
- Descripción: Geocolaboración se refiere a aplicaciones que permiten la interacción entre personas que hacen uso intensivo de datos relacionado a la geolocalizacion de objetos con algún fin. Tipicamente pueden ser aplicaciones para realizar actividades de planificación y diseño en una ciudad, prospeccion minera, analisis de la situación ambiental de una región etc. Últimamente las aplicaciones geocolaborativas que permiten a grupo de personas intercambiar información geolocalizada acerca de actividades turísticas y/o culturales se han popularizado [1]. Estas generalmente se valen de un mapa para indicar dónde están ubicados los lugares turísticos y/o culturales que se quiere compartir. Por otro lado, la digitalizacion de objetos culturales ha tomado también relevancia, complementando los museos reales con sus versiones virtuales [2]. En este trabajo se pretende fusionar las dos ideas, es decir, incluir la posibilidad de incorporar representaciones digitales de objetos culturales incorporados en una aplicación geocolaborativa turística. La idea es que los usuarios puedan simplemente tomar un video de algún objeto (por ejemplo, un monumento) y que este aparezca como representación 3D en el mapa, haciendo más interesantes y atractivas los reportes de viajes. Refs.: [1] Baloian, N., Frez, J., Pino, J. A., & Zurita, G. (2015, September). Supporting Collaborative Decision Making in Geo-Collaboration Scenarios. In CYTED-RITOS International Workshop on Groupware (pp. 63-71). Springer, Cham. [2] Baloian, N., Luther, W., Biella, D., Karapetyan, N., Pino, J. A., Schreck, T., … & Hitschfeld, N. (2017, August). Exploring collaboration in the realm of virtual museums. In CYTED-RITOS International Workshop on Groupware (pp. 252-259). Springer, Cham.
- Objetivo: Storytelling gráfico y BPM
- Profesores Guías: José A. Pino (jpino@dcc.uchile.cl), Nelson Baloian (nbaloian@dcc.uchile.cl)
- Descripción: Los procesos de negocio para un nuevo sistema o uno que está pasando por una re-ingeniería pueden elicitarse a través de varias técnicas, de las cuales una de las más usadas es la entrevista a los usuarios actuales o futuros. Sin embargo, la entrevista tiene una serie de desventajas, entre ellas, el sesgo que pone el entrevistador, la tendencia de los entrevistados a contar la “versión oficial” y no la real, y la omisión de casos especiales. Se ha planteado entonces la posibilidad de que los usuarios cuenten historias vividas sobre el tema del sistema [1]. Sin embargo, los usuarios muchas veces no son buenos para escribir. Otra solución es que los usuarios hagan historietas con sus historias [2]. De hecho, ya hemos hecho experimentos en el ámbito de procesos dentro de la universidad, con resultados buenos [3]. Pero necesitamos más experimentos, ojalá con empleados en empresas y/o instituciones. Este tema de memoria consiste en buscar casos en que se puede aplicar una herramienta ya existente para experimentar el método, y hacerlo. Refs.: [1] Flávia Maria Santoro, Marcos RS Borges, José A Pino: “Acquiring knowledge on business processes from stakeholders’ stories”. Advanced Engineering Informatics 24, 2, 138-148, 2010. [2] Pedro Antunes, David Simões, Luis Carriço, José A Pino: “An end-user approach to business process modeling”. Journal of Network and Computer Applications 36,6, 1466-1479, 2013. [3] Pedro Antunes, José A. Pino, Mary Tate: “Method for Eliciting and Analyzing Business Processes Based on Storytelling Theory”. Proceedings of the 52nd Hawaii International Conference on System Sciences, 2019.
- Objetivo: Herramienta colaborativa de visualizacion de opiniones en Twitter para su análisis.
- Profesores Guías: Nelson Baloian (nbaloian@dcc.uchile.cl)
- Descripción: Twitter puede ser una herramienta interesante para monitorear las tendencias de opinión de la población de un cierto país, una ciudad, una comuna o un barrio. El problema es que es muy difícil poder filtrar y visualizar los tweets que produce la gente en una cierta area región, relacionados a un temá específico. La idea de este trabajo es desarrollar una herramienta que sea capaz de recuperar los tweets que se producen en una cierta área geográfica que se refieren a algún tema especificado por el usuario como un conjunto de strings de búsqueda y que los muestre visualmente de varias maneras para permitir un mejor análisis de cuales son los las tendencias de opnion preponderantes acerca del tema en la región especificada.
- Objetivo: Storytelling oral y BPM
- Profesores Guías: José A. Pino (jpino@dcc.uchile.cl), Nelson Baloian (nbaloian@dcc.uchile.cl)
- Descripción: Los procesos de negocio para un nuevo sistema o uno que está pasando por una re-ingeniería pueden elicitarse a través de varias técnicas, de las cuales una de las más usadas es la entrevista a los usuarios actuales o futuros. Sin embargo, la entrevista tiene una serie de desventajas, entre ellas, el sesgo que pone el entrevistador, la tendencia de los entrevistados a contar la “versión oficial” y no la real, y la omisión de casos especiales. Se ha planteado entonces la posibilidad de que los usuarios cuenten historias vividas sobre el tema del sistema [1]. Sin embargo, los usuarios muchas veces no son buenos para escribir. Otra solución es que los usuarios hagan historietas con sus historias [2]. Una tercera posibilidad innovadora es la siguiente: permitir que oralmente el usuario cuente su historia, la que es grabada en audio o video. Después, el analista completa la historia gráficamente con una historieta. Eventualmente, y con la historieta semi-completa, el analista conversa con el usuario para completarla. La herramienta de historietas ya existe, por lo que la memoria consistiría en buscar uno o dos casos en los cuales aplicar el método y evaluar su conveniencia. Refs.: [1] Flávia Maria Santoro, Marcos RS Borges, José A Pino: “Acquiring knowledge on business processes from stakeholders’ stories”. Advanced Engineering Informatics 24, 2, 138-148, 2010. [2] Pedro Antunes, David Simões, Luis Carriço, José A Pino: “An end-user approach to business process modeling”. Journal of Network and Computer Applications 36,6, 1466-1479, 2013.
- Objetivo: Desarrollo de un Museo Virtual de Moais
- Profesores Guías: José A. Pino (jpino@dcc.uchile.cl), Nelson Baloian (nbaloian@dcc.uchile.cl)
- Descripción: Recientemente ha habido mucho interés por los moais de Isla de Pascua. Sin embargo, el gran público conoce poco de estos monumentos, y en particular, los escolares chilenos. Naturalmente, es infactible que grandes números de personas viajen a Isla de Pascua a conocer los moais en persona. Pero podrían conocerlos a través de un museo virtual [1]. Este museo podría tener facilidades especialmente orientadas a los más jóvenes. Por ejemplo, actividades lúdicas tales como “serious games” con intención educativa y también juegos de entretención. Por otro lado, las facilidades podrían también posibilitar a los visitantes escribir historias (“storytelling”) textual o gráficamente sobre los temas del museo. El desarrollo del museo incluiría la selección de fotos de moais para incorporarlas al acervo del museo. Se buscará colaboración con entidades públicas y privadas relacionadas al tema. Ref.: [1] Nelson Baloian, Wolfram Luther, Daniel Biella, Nare Karapetyan, José A Pino, Tobias Schreck, Andres Ferrada, Nancy Hitschfeld: “Exploring collaboration in the realm of virtual museums”. CYTED-RITOS International Workshop on Groupware, 2017, 252-259, Springer.
- Objetivo: Framework para elegir un ERP Open Source aplicado a la realidad Chilena
- Profesor Guía: Andrés Muñoz Órdenes (andmunoz@dcc.uchile.cl)
- Descripción: A raíz de las muchas opciones de software open source para implementar ERPs (e.g. Moqui, Ofbiz, idempiere, openbravo, odoo y otras) se requiere formular una metodología que que en base a distintos criterios de decisión para a los distintos tipos de necesidades de empresas Chilenas permita seleccionar el ERP más adecuado. Aparte de dar lineamientos para la toma de decisión de un ERP para empresas Chilenas, el trabajo también consistirá en implementar un ERP piloto en dos de las tecnologías ERP Open source más avanzadas (se sugiere Moqui y Ofbiz) de tal manera de hacer más clara la comparación y además ayudar a futuras empresas que se basen en ese desarrollo para implementar su propio ERP.
- Objetivo: Desarrollo de una herramienta de arbitraje para criptomonedas basado en Moqui
- Profesor Guía: Andrés Muñoz Órdenes (andmunoz@dcc.uchile.cl)
- Descripción: El arbitraje es el ejercicio de comprar un activo y venderlo más caro inmediatamente después, asumiendo muy poco o nada de riesgo en la transacción. En el caso de las criptomonedas, se busca lograr el desarrollo de una herramienta, basado en el framework de Moqui (http://www.moqui.org), que apoye este arbitraje, entregando información relevante a los usuarios para cuando y donde vender o comprar sus criptomonedas.
- Objetivo: Desarrollo de una módulo para Moqui que permita la autenticación utilizando uPort
- Profesor Guía: Andrés Muñoz Órdenes (andmunoz@dcc.uchile.cl)
- Descripción: uPort es una tecnología abierta para el manejo de identidad de los usuarios sobre Ethereum. Con esta identidad se puede validar credenciales, firmar transacciones y manejo seguro de llaves y datos. Lo que se busca con este tema es que el alumno pueda investigar e implementar un medio de autenticación con uPort sobre el framework de Moqui (http://www.moqui.org) y que desarrolle una aplicación real con él. Como ejemplo de esto, actualmente tenemos dos aplicaciones a desarrollar: apertura de puerta para oficinas y autenticación para ingresar a sistemas.
- Objetivo: Integración de medios de comunicación sobre canales sociales y de mensajería instantánea utilizando Moqui
- Profesor Guía: Andrés Muñoz Órdenes (andmunoz@dcc.uchile.cl)
- Descripción: Las empresas modernas tienen medios digitales de comunicación, a través de los cuales el cliente o proveedor puede llegar. Estos medios son chats en el sitio web, apps de mensajería como telegram, whatsapp, chat de facebook, redes sociales como twitter, facebook y el correo electrónico. La omnicanalidad apunta que el usuario, independiente del canal de comunicación que utilice para comunicarse con una empresa, sea transversal a la relación que quiere mantener con él. De esta manera, puede comenzar la comunicación por un mensaje de Facebook y terminar conversando por Telegram pero detrás se mantiene la comunicación. Lo que se espera es que el alumno pueda implementar diferentes medios de mensajería sobre el framework de Moqui (http://www.moqui.org), investigando y determinando los mejores plugins que permitan integrar estos medios de comunicación y llevarlos como información para mantener una comunicación omnicanal con sus clientes o proveedores.
- Objetivo: Desarrollo de un módulo de marketing digital utilizando Moqui
- Profesor Guía: Andrés Muñoz Órdenes (andmunoz@dcc.uchile.cl)
- Descripción: Algo que las empresas buscan es crear un canal digital para promocionar sus productos y servicios, pero que se encuentre bajo supervisión para medir su efectividad. Es por esta razón que muchas empresas contratan servicios de marketing que les entregan información de cómo su marca o producto evoluciona en medios digitales como redes sociales y el alcance de sus campañas digitales por correos electrónicos. Lo que se espera es que el alumno pueda desarrollar un módulo de marketing digital para el framework de Moqui (http://www.moqui.org), en donde pueda crear campañas para diferentes medios digitales (redes sociales, correo electrónico, apps de mensajería) y que pueda mantener información en un tablero de control sobre la efectividad en base a los parámetros que hoy en día se utilizan como alcance de la campaña, visualizaciones, conversión, menciones, hashtags y reenvíos.
- Objetivo: Desarrollo de una herramienta de monitoreo de marca utilizando Moqui
- Profesor Guía: Andrés Muñoz Órdenes (andmunoz@dcc.uchile.cl)
- Descripción: Algo que las empresas y figuras públicas preocupan mucho es de la imagen. Sin embargo, por el explosivo uso de redes sociales y medios digitales, preocuparse de todo es bastante costoso. Es por eso que los Community Managers realizan este trabaja, pasando horas y horas revisando menciones, hashtags y mensajes que pueden ser favorables o nocivos para sus clientes. Lo que se espera es que el alumno pueda desarrollar un módulo, utilizando el framework de Moqui (http://www.moqui.org), que permita realizar búsquedas de información en redes sociales y prensa online y pueda entregar información a través de reportes y/o gráficos que definan el comportamiento de una marca o producto en estos medios digitales. Además de ello, incluir alertas de astroturfing que permitan de inmediato realizar actividades ante acciones nocivas a la imagen de una marca.
- Objetivo: Integración de dispositivos biométricos para la autenticación con huella digital en Moqui
- Profesor Guía: Andrés Muñoz Órdenes (andmunoz@dcc.uchile.cl)
- Descripción: La huella digital es uno de los medios biométricos de autenticación más utilizados, ya que se encuentra registrado en nuestra cédula de identidad. Las empresas por su parte están utilizándolo también como medio de acceso a diferentes recursos: abrir puertas, tickets para almuerzo en casinos, reloj contro, etc. Lo que se espera es que el alumno pueda desarrollar un módulo, utilizando el framework de Moqui (http://www.moqui.org), que permita manejar la autenticación en una ubicación física con la huella digital. Para ello, debe considerar que primero existe un proceso de enrolamiento, en donde se enlaza la huella digital al usuario, de esta forma se habilita a cada uno de los usuario el uso de su huella.
- Objetivo: Extensión de Moqui para la utilización de dispositivos PoS con la API QZ.io
- Profesor Guía: Andrés Muñoz Órdenes (andmunoz@dcc.uchile.cl)
- Descripción: QZ.io (https://qz.io/) es una API que permite conectar y manipular diferentes dispositivos móviles, tales como: impresoras térmicas, pesas digitales, lectores de código de barras, PoS de Transbank. Lo que se espera es que el alumno pueda integrar esta librería en el framework de Moqui (http://www.moqui.org) y desarrollar una aplicación práctica para el uso de algunos de estos dispositivos.
- Objetivo: Análisis y desarrollo de adaptación de Moqui para realizar Screen Injection
- Profesor Guía: Andrés Muñoz Órdenes (andmunoz@dcc.uchile.cl)
- Descripción: Una de las ventajas que tiene el framework Moqui (http://www.moqui.org) es que viene con pantallas estándares ya creadas para los diferentes módulos que maneja (RRHH, Finanzas, Ventas, etc). Esto se convierte en una facilidad cuando la empresa utiliza el framework tal cual viene. Sin embargo, cuando se requiere personalizar o localizar algunos campos, el trabajo de personalización se convierte en invertir horas de desarrollo en re-construir las pantallas para ajustarlas a las necesidades particulares del cliente. Lo que se espera del alumno es que pueda investigar, proponer e implementar una forma de hacer Screen Injection, de manera de que se puedan generar cambios a pantallas estándares sin tener que realizar copias y personalizaciones mayores, sino más bien “configuraciones” específicas que puedan cambiar tipos de campos del formulario o valores a utilizar.
- Objetivo: Desarrollo y aplicación de Kanban para el módulo HiveMind de Moqui
- Profesor Guía: Andrés Muñoz Órdenes (andmunoz@dcc.uchile.cl)
- Descripción: HiveMind es una implementación para la gestión de proyectos desarrollado sobre el framework Moqui (http://www.moqui.org). Sin embargo, al igual que muchas herramientas de seguimiento de proyectos, la visualización y control de las tareas en el día a día se hace abrumadora y poco práctica, por lo que los integrantes del equipo registran cada cierto tiempo sus avances. Más aún, los gestores de los proyectos no pueden establecer fácilmente el avance, ya que deben estimar a raíz de porcentaje de completitud cada tarea, lo cual muchas veces no es realista. Kanban es un método lean para gestionar y mejorar proyectos, gestionando el trabajo por balanceo de la demanda con la capacidad disponible y mejorando el manejo de los cuellos de botella. Dado esto, los tableros Kanban son una forma de visualizar, de una manera efectiva, los avances, a través de una pizarra de tarjetas que van viajando desde las columnas de la izquierda hasta las de la derecha. Sistemas de gestión de proyectos (no solo informáticos) actualmente permiten el uso de Kanban para una mayor visualización y gestión de dichas tareas. Lo que se espera es que el alumno pueda investigar, proponer y desarrollar una mejora que se pueda incorporar al módulo Hivemind para utilizar visualización de proyectos con tableros Kanban y mejorar la gestión.
- Objetivo: Estructura comprimida simplificada para indexar texto basada en gramáticas
- Profesores Guías: Gonzalo Navarro (gnavarro@dcc.uchile.cl)
- Descripción (Memoria o Doble Titulación) Existen varias representaciones de texto cuyo espacio es proporcional a una gramática libre del contexto que lo genera, lo cual las hace particularmente comprimidas cuando el texto es repetitivo. Estas representaciones permiten además buscar dónde ocurre un determinado patrón en el texto sin recorrerlo ni descomprimirlo. En esta memoria se propone implementar una variante simplificada (ya definida), la cual se espera que sea más fácil de implementar que las existentes, y comparar su rendimiento en espacio y tiempo de búsqueda. Puede llevar a una publicación si los resultados son buenos. [Todavía disponible el 22/1]
- Objetivo: Estructuras comprimidas dinámicas para worst-case-optimal joins en bases de datos de grafos.
- Profesores Guías: Gonzalo Navarro (gnavarro@dcc.uchile.cl)
- Descripción El Ring es una estructura compacta que, usando un 5% del espacio de las estructuras clásicas, puede resolver multijoins en tiempos similares, y siendo worst-case-optimal, una propiedad teórica muy apreciada. Su mayor impacto es que no necesita representar los 6 órdenes que las estructuras tipo trie necesitan, lo que le hace ocupar menos espacio. En esta memoria se plantea explotar el hecho de que esto le permite también actualizarse más eficientemente cuando al grafo se le agregan o quitan aristas o nodos. La memoria consiste en tomar la estructura de Ring ya implementada y reemplazar los bitmaps que utiliza por variantes dinámicas, lo que los hace más lentos pero permite modificar el grafo con pocas operaciones. Luego de ello, realizar benchmarks para establecer cómo se comporta frente a la variante estática del Ring y frente al estado del arte. Puede llevar a una publicación si los resultados son buenos. [Todavía disponible el 22/1]
- Objetivo: Analítica de grafos usando estructuras compactas
- Profesores Guías: Gonzalo Navarro (gnavarro@dcc.uchile.cl)
- Descripción (Memoria o Doble Titulación): El Ring es una estructura compacta que, usando un 5% del espacio de las estructuras clásicas, puede resolver multijoins en tiempos similares, y siendo worst-case-optimal, una propiedad teórica muy apreciada. En esta memoria larga se plantea utilizarlo para tareas de analítica de grafos, en particular para queries donde algunas variables no nos interesan, sino que queremos contar cuántas soluciones hay para cada combinación de las variables no mudas (ej. se puede querer contar el número de triángulos en el grafo). El Ring tiene capacidad, en algunos casos, de trabajar sobre rangos de valores de una sola vez. Se plantea estudiar la forma de que resuelva estas consultas más rápidamente que enumerando una a una todas las soluciones (y comparar contra este baseline). Puede llevar a una publicación si los resultados son buenos. [Todavía disponible el 22/1]
- Objetivo: Ranked enumeration sobre estructuras compactas
- Profesores Guías: Gonzalo Navarro (gnavarro@dcc.uchile.cl)
- Descripción (Memoria o Doble Titulación): Los Qdags son estructuras similares de Quadtrees comprimidos que se han usado para resolver multijoins en forma worst-case-optimal en grafos con labels. Un problema relacionado es el de poder entregar los primeros resultados lo más rápidamente posible. En esta memoria se plantea modificar la estructura de datos de los Qdags, cambiando el árbol sucinto de formato LOUDS a DFUDS, lo que permitirá estimar el número de soluciones a encontrar en cada rama, de modo de explorar primero las ramas más promisorias. La memoria consiste en cambiar la representación, modificar el algoritmo existente, y correr benchmarks para determinar el rendimiento de esta solución comparada con la clásica. La memoria se puede extender permitiendo que los datos tengan un peso o importancia, de modo de extraer primero los más importantes, usando una extensión de la representación. Puede llevar a una publicación si los resultados son buenos. [Todavía disponible el 22/1]
- Objetivo: Solución de multijoins en grafos con labels usando representaciones compacta
- Profesores Guías: Gonzalo Navarro (gnavarro@dcc.uchile.cl)
- Descripción (Doble Titulación): Los multijoins en bases de datos de grafos con labels son subgrafos con algunos nodos y labels (de aristas) instanciados y otros no. Se pueden resolver en forma worst-case-optimal usando un algoritmo llamado Leapfrog Triejoin. En esta memoria larga se plantea implementar este algoritmo sobre una repersentación compacta del grafo, la cual da algunas facilidades que no tienen las representaciones clásicas. Se espera obtener un algoritmo que use menos espacio que los clásicos y que sea competitivo con los existentes. La memoria consiste en implementar la representación del grafo, adaptar el Leapfrog para correr sobre él, y correr benchmarks establecidos para comparar la solución con otras del estado del arte. Puede llevar a una publicación si los resultados son buenos. [Todavía disponible el 22/1]
- Objetivo: Búsqueda de expresiones regulares en grafos con labels usando representaciones compactas
- Profesores Guías: Gonzalo Navarro (gnavarro@dcc.uchile.cl)
- Descripción (Memoria o Doble Titulación): Las Regular Path Queries (RPQs) son usadas para extraer información de grafos con labels. Existe un algoritmo básico para encontrar todos los pares de nodos (u,v) tal que existe un camino de u a v donde la secuencia de labels está en el lenguaje de la RPQ. En esta memoria se plantea implementar este algoritmo sobre una representación compacta del grafo, la cual da algunas facilidades que no tienen las representaciones clásicas. Se espera obtener un algoritmo que sea a la vez más rápido y que use menos espacio que los clásicos. La memoria consiste en implementar la representación del grafo, el algoritmo que corre sobre él, y correr benchmarks establecidos para comparar la solución con otras del estado del arte. Puede llevar a una publicación si los resultados son buenos. [Todavía disponible el 22/1]
- Objetivo: Uso de árboles LOUDS cardinales para implementar tries y multijoins óptimos en bases de datos de grafos
- Profesores Guías: Gonzalo Navarro (gnavarro@dcc.uchile.cl)
- Descripción: La técnica llamada Leapfrog Triejoin permite realizar multijoins en bases de datos de grafos en forma worst-case-optimal. Nos centramos en bases de datos tipo RDF, con aristas rotuladas por “predicados” que conectan un sujeto a un objeto, tipo Gonzalo –[profesor-de]–> Algoritmos. Un problema que presenta el Leapfrog es que necesita mucho espacio, pues requiere indexar los 3 datos (sujeto,predicado,objeto) en los 3! = 6 órdenes posibles. En esta memoria se busca explorar una representación comprimida de esos tries usando árboles cardinales representados en forma compacta con la técnica LOUDS (Level-Ordered-Unary-Degree-Sequence). Una alumna está terminando una memoria donde se exploran otras dos alternativas más directas; se espera que esta nueva representación ofrezca incluso mejor espacio. La memoria consiste en aprender el algoritmo (que ya está implementado) y la representación, implementar la representación para que el algoritmo corra sobre ella, y comparar el resultado con representaciones existentes sobre benchmarks ya establecidos. Puede llevar a una publicación si los resultados son buenos. [Todavía disponible el 22/1]
- Objetivo: Implementación de una estructura dinámica y sucinta para representar diccionarios
- Profesores Guías: Gonzalo Navarro (gnavarro@dcc.uchile.cl)
- Descripción: Un diccionario almacena un conjunto de strings y permite buscar en él. Los diccionarios aparecen en muchas aplicaciones, donde se requiere manejar internamente identificadores numéricos para un conjunto finito de strings (ej. URLs). Cuando los diccionarios son muy grandes, almacenarlos eficientemente es un desafío. Existe un trabajo bastante exhaustivo sobre representación compacta de diccionarios (ver https://users.dcc.uchile.cl/~gnavarro/ps/is15.2.pdf). Estos diccionarios, sin embargo, son estáticos, es decir, una vez construidos no se les puede insertar o borrar strings. La memoria consiste en revisar las alternativas estáticas y diseñar alguna variante dinámica, para luego compararla con otros diccionarios dinámicos (la mayoría de los cuales no comprime) y también ver cuánto se degradan los tiempos de búsqueda con respecto a los estáticos. Puede llevar a una publicación si los resultados son buenos. [Todavía disponible el 22/1]
- Objetivo: Desarrollo de un Editor de Escenarios de Interacción entre Usuarios de Sistemas Colaborativos
- Profesores Guías: Sergio Ochoa (sochoa@dcc.uchile.cl), Daniel Perovich (dperovic@dcc.uchile.cl)
- Descripción: (Memoria o Doble Titulación) Este trabajo de memoria busca desarrollar una aplicación Web que permita representar visualmente y validar los escenarios de interacción entre usuarios que son apoyados por un sistema colaborativo cualquiera (esto va desde aplicaciones como WhatsApp, hasta sistemas colaborativos a la medida). Estos escenarios son representados a través de grafos, donde los nodos y los arcos deben respetar una cierta nomenclatura, y cada elemento tiene una semántica específica. Por lo tanto, en forma simplificada, este trabajo de memoria/tesis debe desarrollar un editor de grafos para apoyar la construcción y validación de un tipo de modelo particular, que son los escenarios (grafos) de interacción entre usuarios. Estos grafos son utilizados para generar automáticamente los requisitos de interacción entre usuarios (requisitos de software), que es necesario considerar a la hora de desarrollar este tipo de sistemas. Actualmente se cuenta con una herramienta en JScript que usa la librería D3 para realizar el manejo gráfico de grafos; esta herramienta puede ser utilizada de base para desarrollar el nuevo editor.
- Objetivo: Desarrollo de un Tablero Digital de Apoyo al Levantamiento de Requisitos de Sistemas de Información y de Sistemas IoT
- Profesores Guías: Sergio Ochoa (sochoa@dcc.uchile.cl), Daniel Perovich (dperovic@dcc.uchile.cl)
- Descripción: (Memoria o Doble Titulación) Este trabajo de memoria busca desarrollar una aplicación Web que permita manipular post-its de manera colaborativa sobre un tablero digital. El tablero digital tendrá una estructura que estará en sintonía con la arquitectura típica de un sistema de información, o bien de un sistema IoT. Los desarrolladores y los clientes utilizarán post-its digitales, que colocarán en las distintas secciones del tablero digital, para determinar y acordar el alcance de un proyecto de software (de los tipos antes señalados). Como resultado se obtendrá una descripción del objetivo y la funcionalidad principal del producto a desarrollar.
- Objetivo: Desarrollo de un Servicio de Monitoreo de las Actividad Sociales Presenciales de los Adultos Mayores
- Profesores Guías: Sergio Ochoa (sochoa@dcc.uchile.cl), Francisco Gutiérrez (frgutier@dcc.uchile.cl)
- Descripción: (Memoria o Doble Titulación) Las actividades sociales presenciales (por ejemplo, las reuniones con familiares o amigos) son muy importantes para el bienestar físico y emocional de los adultos mayores. A pesar de su importancia, particularmente para los adultos mayores que viven solos, no se han identificado mecanismos simples y no intrusivos para determinar si estas personas tienen un déficit de actividades sociales presenciales, y de esa manera poder adelantarse a la situación antes de que se le transforme en un problema (por ejemplo, en depresión). Este trabajo de memoria busca definir e implementar un mecanismo autónomo de monitoreo de las actividades sociales presenciales que los adultos mayores llevan a cabo al interior de sus hogares, de manera no intrusiva y respetando su privacidad. Este servicio deberá realizar la captura de información a través de los periféricos de una tablet PC normal, y almacenar y procesar dicha información con el fin de mantener un diagnóstico permanente acerca de la “salud social” de estas personas. En caso de detección de un déficit de actividades sociales presenciales, el sistema deberá emitir alertas o notificaciones a las personas o instituciones encargadas de apoyar al adulto mayor.
- Objetivo: Desarrollo de un Mecanismo de Persuasión para Apoyar el Cuidado Familiar de Adultos Mayores que Viven Solos
- Profesores Guías: Sergio Ochoa (sochoa@dcc.uchile.cl), Francisco Gutiérrez (frgutier@dcc.uchile.cl)
- Descripción: (Memoria o Doble Titulación) La mayoría de los adultos mayores desean envejecer viviendo en su propio hogar hasta que ya no puedan valerse por si mismos. En ese proceso, las personas van necesitando cada vez más apoyo familiar para realizar diversas tareas, que van desde el arreglo de cosas rotas en su hogar, hasta acompañarlos al médico. Por otra parte, los miembros más jóvenes de la familia (hijos y nietos) tienen sus propias agendas de actividades, que no siempre permiten apoyar a los adultos mayores de manera adecuada. Este trabajo de memoria pretende desarrollar un servicio de software que, ante la necesidad de ayuda por parte de un adulto mayor, identifique un subconjunto pequeño de miembros de la familia que podrían ayudar al adulto mayor en dicha actividad. Además, el servicio deberá implementar mecanismos de persuasión para que esas personas (los más jóvenes) accedan a ayudar. La solución deberá mantener un buen balance entre las solicitudes que se les hace a los distintos miembros de la familia, para que de esa manera no se sobrecargue a nadie. Los mecanismos de persuasión muy probablemente deberán implementar estrategias de gamification.
- Objetivo: Extensión de una Aplicación de Apoyo a la Gestión de Clases para el Área de Educación Continua del DCC
- Profesor Guía: Sergio Ochoa (sochoa@dcc.uchile.cl)
- Descripción: El Programa de Educación Continua (PEC) del DCC gestiona anualmente diversos diplomados, postítulos y cursos que se dictan a profesionales de la industria. Actualmente el Departamento cuenta con una herramienta Web (desarrollada en el curso CC5401: Ingeniería de Software II) que permite registrar dichos cursos y programas, y calendarizar las clases asociadas a ellos. Este trabajo de memoria busca extender y mejorar dicha herramienta, por ejemplo, permitiendo la reserva automática de salas de clases. Para ello el sistema deberá interactuar de forma bidireccional con el sistema SAR (Sistema de Asignación de Recursos del DCC), el cual se encuentra actualmente en producción. La extensión deberá también permitir una interacción más automática y fluida entre el personal del PEC, los profesores y los alumnos. Además, deberá entregar información de monitoreo de clases, y de apoyo a la toma de decisiones para los coordinadores de cada programa. Este trabajo deberá abordar varios desafíos de usabilidad, interoperabilidad y seguridad.
- Objetivo: Boosting visual space using texts in eCommerce search engines.
- Profesor Guía: José M. Saavedra R. (jmsaavedrar@miuandes.cl)
- Descripción: Aquí extenderemos un trabajo reciente en el que demostramos mejoras significativas en motores de búsqueda visual en eCommerce aprovechando información textual que encontramos en las descripciones de los catálogos objetivos. Una de las estrategias a evaluar es representando el espacio de textos mediante una red neuronal de grafos. (Este tema puede ser adaptado a un trabajo de Magíster).
- Objetivo: Self-supervision + attention for sketch-based image retrieval.
- Profesor Guía: José M. Saavedra R. (jmsaavedrar@miuandes.cl)
- Descripción: En uno de nuestros recientes trabajos propusimos extendimos una arquitectura autosupervisada unimodal al contexto bimodal de sketch-based retrieval. Ahora, en esta propuesta, agregaremos componentes autoatencionales tipo transformers para sketch-based retrieval. (Este tema puede ser adaptado a un trabajo de Magíster).
- Objetivo: One-shot object detection
- Profesor Guía: José M. Saavedra R. (jmsaavedrar@miuandes.cl)
- Descripción: Evaluaremos modelos autosupervisados con atención cruzada para entrenar modelos one-shot detection. Actualmente tenemos a un estudiante de magíster desarrollando experimentos y necesitamos memoristas que nos ayuden con más experimentación. (Este tema puede ser adaptado a un trabajo de Magíster).
- Objetivo: Self-supervised learning for multi-modal image retrieval
- Profesor Guía: José M. Saavedra R. (jmsaavedrar@miuandes.cl)
- Descripción: En los últimos tiempos hemos visto avances en modelos autosupervisados orientados a obtener representaciones visuales que aprovechen la gran cantidad de imágenes no etiquetados existentes y que favorezcan la generalización de los modelos. Por ejemplo BYOL y SwAV son ejemplos de estos modelos. Sin embargo, hay pocos experimentos de estos modelos en ambientes multi-modales, como es el caso de recuperación de imágenes basada en sketches (SBIR). Así, en esta propuesta se trata de extender modelos tipo BYOL o SwAV para resolver el problema SBIR. (Este tema puede ser adaptado a un trabajo de Magíster).
- Objetivo: Semi-supervised color sketch-based image retrieval.
- Profesor Guía: José M. Saavedra R. (jmsaavedrar@miuandes.cl)
- Descripción: Durante los últimos años hemos visto significativos avances en sketch-based image retrieval (SBIR), de la mano de modelos basados en deep-learning. Sin embargo, estos modelos suponen un sketch formado solamente por trazos, sin color ni textura, lo que representa una gran limitación en contextos relacionados con arte, moda y decoración, donde los colores y las texturas representan atributos críticos. Resolver este problema en modo supervisado, requeriría la existencia de una gran cantidad de sketches coloreados, que resulta impráctico. Sin embargo, existe una gran cantidad de datasets relacionados con sketches simples que representan la semántica de lo que se quiere recuperar. Así, en este trabajo exploraremos métodos semi-supervisados que permitan aprovechar la gran catidad de datasets de simple sketches para resolver el problema CSBIR. Algunas referencias son:
- Sketch-QNet, A Quadruplet ConvNet for Color Sketch-Based Image Retrieval: https://openaccess.thecvf.com/content/CVPR2021W/SketchDL/papers/Fuentes_Sketch-QNet_A_Quadruplet_ConvNet_for_Color_Sketch-Based_Image_Retrieval_CVPRW_2021_paper.pdf
- Fine-Grained Color Sketch-Based Image Retrieval: https://link.springer.com/chapter/10.1007/978-3-030-22514-8_40
- Objetivo: Visual-based recomendations for eCommerce
- Profesor Guía: José M. Saavedra R. (jmsaavedrar@miuandes.cl)
- Descripción: En este trabajo se trata de desarrollar un modelo de recomendación visual, entrenado bajo un esquema semi-supervisado sobre un conjunto de imágenes de catálogos de eCommerce (fashion). El objetivo es crear representaciones visuales, de modo tal, que prendas de vestir complementarias estén cerca en el espacio inferido. El modelo tiene una primera parte supervisada para generar un modelo de detección de prendas; y una segunda parte, auto-supervisada, que trata de aprender el espacio de recomendación (para la segunda parte se utilzarán modelos basados en redes siamesas).
- Objetivo: Sketch-based object localization
- Profesor Guía: José M. Saavedra R. (jmsaavedrar@miuandes.cl)
- Descripción: Aquí, se trata de extender la idea de detección de objetos en imágenes, pero donde la consulta es un dibujo (sketch). Nos basaremos en el trabajo de Tripathi et al. [https://arxiv.org/pdf/2008.06551.pdf] agregando módulos de autoatención, con el objetivo de mejorar la precisión de los resultados. (Este tema puede ser adaptado a un trabajo de Magíster).
- Objetivo: Métodos NLP y visuales para búsqueda de productos en e-commerce
- Profesor Guía: Juan Manuel Barrios (juanmanuel@barrios.cl https://juan.cl)
- Descripción: Las tiendas de e-commerce organizan sus catálogos en línea en fichas de productos. Las fichas de productos contienen datos textuales (atributos/categorías) y visuales (imágenes). El objetivo es evaluar técnicas NLP para búsqueda de productos y su combinación con características visuales y textuales. En particular algunos objetivos:
- Entrenar un modelo de self-attention para buscar productos por texto
- Generación de un embedding multimodal de texto+imagen para productos
- Generación de atributos visuales de productos para complementar la búsqueda por texto
- Implementación de búsqueda visual de productos cuando aparecen múltiples productos en las fichas de producto
- Objetivo: Definición y evaluación de acciones para aumentar la conversión de un e-commerce
- Profesor Guía: Juan Manuel Barrios (juanmanuel@barrios.cl https://juan.cl)
- Descripción: Se cuenta con datos de tráfico y ventas de algunos sitios de e-commerce (visitas, usuarios, clicks, ventas). Utilizando técnicas de Data Science se pueden encontrar productos que potencialmente puedan aumentar su conversión si se realizan acciones como aumentar su visibilidad, ajustar su precio o crear promociones. El objetivo de la memoria consiste en aplicar Data Science en un e-commerce para aplicar acciones de marketing sobre productos con buen potencial de aumento de ventas y evaluar si esas acciones lograron un aumento en las ventas. La memoria es un proyecto de Ciencia de Datos, donde se define una hipótesis, se realizan experimentos y se evalúa si se observó el efecto esperado.
- Objetivo: Búsquedas personalizadas para e-commerce
- Profesor Guía: Juan Manuel Barrios (juanmanuel@barrios.cl https://juan.cl)
- Descripción: Se cuenta con datos de tráfico y ventas de algunos sitios de e-commerce (visitantes, sesiones, búsquedas, clicks). Con esos datos se pueden crear perfiles de usuarios y elaborar un sistema de recomendación de productos. Usualmente los sistemas recomendadores consisten en un carrusel de despliegue de productos que podrían interesar al usuario. Sin embargo, se desea aplicar esas recomendaciones dentro del buscador de productos. El objetivo de la memoria consiste en implementar un algoritmo de rankeo de productos tal que aumente la visibilidad de los productos que cumplen con la consulta del usuario y que además sean parte de su conjunto de intereses. Para eso será necesario usar deep learning para entrenar espacios que combinan datos de productos (textos, imagenes) con intereses del usuario (búsquedas hechas, productos visitados).
- Objetivo: Estudiar Representaciones Incrementales de Texto
- Profesor Guía: Felipe Bravo-Marquez (fbravo@dcc.uchile.cl) http://felipebravom.com
- Descripción: La representación de texto en espacios vectoriales es una componente fundamental de la mayoría de los modelos del estado del arte en el procesamiento de lenguaje natural NLP. Ejemplos importantes son los Language Models y los Word Embeddings. Sin embargo, como estos modelos se entrenan de manera estática, no son capaces de adaptarse a variaciones del lenguaje. Ejemplo: hashtags nuevos en tweets o variaciones semánticas (palabras que cambian su significado en el tiempo). El objetico de este proyecto es implementar adaptaciones ligeras e incrementales de vectores de palabras y oraciones. Se requerie conocimiento en minería de datos y apredizaje de máquinas.
- Objetivo: Representaciones compatibles para entidades de una red social
- Profesor Guía: Felipe Bravo-Marquez (fbravo@dcc.uchile.cl) http://felipebravom.com
- Descripción: La vectorización de objetos es escencial para poder clasificarlos usando machine learning. En una red social tenemos objetos de diversa naturaleza que co-existen: usuarios, texto, imágenes, etc.. La hipótesis de este proyecto es que si podemos proyectar objectos distintos al mismo espacio, entonces podríamos aplicar clasificadores entrenados para datos de un tipo sobre otro. Por ejemplo, imaginemos que tenemos tweets anotados por sentimiento. Ese dataset lo podríamos usar para entrenar un clasificador de sentimiento an nivel de tweet. Supongamos que queremos clasificar usuarios de Twitter por sentimiento. Si tenemos vectores compatibles podríamos usar el modelo entrenado sobre tweets para clasificar usuarios. Se requiren conocimientos básicos en aprendizaje de máquinas y minería de datos.
- Objetivo: Sesgo en modelos de representación de palabras.
- Profesor Guía: Felipe Bravo-Marquez (fbravo@dcc.uchile.cl) http://felipebravom.com
- Descripción: Los word embeddings son vectores de palabras entrenados sobre grandes colecciones de documentos que hoy en día son ampliamente usados para el procesamiento de lenguaje natural. Diversos estudios han mostrado que los modelos de word embeddings exhiben sesgos estereotípicos de género, raza y religión, entre otros criterios. Varias métricas de equidad se han propuesto para cuantificar automáticamente estos sesgos. WEFE, the word embeddings fairness evaluation framework, es un marco teórico y una librería en Python para encapsular, evaluar y comparar diversas métricas de equidad desarrollada en el DCC: https://wefe.readthedocs.io/en/latest/. La idea es buscar un tema de memoria o tesis que involucre usar o mejorar WEFE.
- Objetivo: Análisis a gran escala de aplicaciones Android
- Profesor Guía: Alexandre Bergel (abergel@dcc.uchile.cl), Geoffrey Hecht (geoffrey.hecht@gmail.com)
- Descripción: “Android code smells” son malas prácticas de implementación dentro de las aplicaciones Android que pueden conducir a una mala calidad de software. Se sabe que estos olores de código degradan el rendimiento de las aplicaciones y tienen un impacto en el consumo de energía. Ya hemos desarrollado una herramienta llamada Paprika para detectar estos olores y la hemos utilizado con éxito en más de tres mil aplicaciones. Ahora queremos analizar cientos de miles de aplicaciones de este tipo, sin embargo, viene con muchos desafíos relacionados con el análisis de big data: la recolección y almacenamiento de los datos, Paralización del análisis y procesamiento de los resultados.
- Objetivo: Identificación del ofuscador en aplicaciones Android mediante aprendizaje automático
- Profesor Guía: Alexandre Bergel (abergel@dcc.uchile.cl), Geoffrey Hecht (geoffrey.hecht@gmail.com)
- Descripción: Los desarrolladores de Android suelen utilizar la ofuscación de aplicaciones para proteger sus aplicaciones y la propiedad intelectual. Aunque la ofuscación proporciona protección, representa un obstáculo para una serie de de análisis de programas legítimos e ingeniería inversa. Utilizando el aprendizaje automático y un conjunto de datos de aplicaciones Android de código abierto queremos poder determinar el ofuscador y los parámetros de ofuscación utilizados para compilar cualquier aplicación Android. Gracias a esto, queremos realizar un estudio empírico sobre un gran conjunto de datos de cientos de miles de aplicaciones disponibles en las diferentes tiendas Android.
- Objetivo: Impacto de los ofuscadores en el rendimiento de las aplicaciones Android
- Profesor Guía: Alexandre Bergel (abergel@dcc.uchile.cl), Geoffrey Hecht (geoffrey.hecht@gmail.com)
- Descripción: Los desarrolladores de Android suelen utilizar la ofuscación de aplicaciones para proteger sus aplicaciones y la propiedad intelectual. Aunque la ofuscación proporciona protección y puede proporcionar optimización automática, poco se sabe sobre el impacto de las diferentes estrategias de ofuscación en el rendimiento de las aplicaciones. Basándonos en un conjunto de datos de aplicaciones Android de código abierto, queremos perfilar el impacto en el rendimiento de las diferentes estrategias de ofuscación utilizando varias métricas y las herramientas de perfilado proporcionadas por el Android Debug Bridge (adb).
- Objetivo: Ingeniería reversa de apps financieras (y wallets) chilenas.
- Profesor Guía: Alejandro Hevia (ahevia@dcc.uchile.cl)
- Descripción: (Memoria) En los últimos dos años, muchos bancos e instituciones financieras han creado aplicaciones financieras y de tipo “wallet”. En este proyecto, se busca estudiar la seguridad de una o varias de ellas (dependiendo de la complejidad del análisis y de su automatización), utilizando ingeniería reversa y simuladores especialmente modificados para el proceso. Por las características de estas aplicaciones y por temas legales, el análisis debe ser pasivo respecto a los servidores.
- Objetivo: Nuevas estrategias de escaneos activos de redes IPv6.
- Profesor Guía: Alejandro Hevia (ahevia@dcc.uchile.cl)
- Descripción: (Memoria o Doble Titulación) El escaneo activo de una red permite detectar máquinas y servicios públicamente disponibles cuya seguridad sea insuficiente, para luego reportarlas y proactivamente evitar ataques. El escaneo activo de redes IPv6 es en principio infactible por la cantidad estratosférica de direcciones disponibles. Sin embargo, limitaciones naturales de ruteo, visibilidad de servicios y operación pueden ser usados como guía para diseñar mecanismos para seleccionar segmentos donde explorar. En este proyecto se busca explorar, identificar y evaluar algunos de estos mecanismos.
- Objetivo: Uso de aleatoriedad verificable para transparencia en el sampleo de experimentos científicos
- Profesor Guía: Alejandro Hevia (ahevia@dcc.uchile.cl)
- Descripción: (Memoria o Doble Titulación) El servicio Random UChile (random.uchile.cl) es un servicio online que provee aleatoriedad verificable en la forma de valores aleatorios públicos, no influenciables, y verificables cada minuto. En este proyecto se propone su uso para diseñar, implementar y testear una aplicación que permita a quienes realizan experimentos científicos que requieran de sampleo (biología, medicina, sociología, etc) utilizar aleatoriedad verificable para demostrar transparentemente la correctitud de sus experimentos.
Educación Online / VTI
La Unidad de Educación Online de la Universidad de Chile es una nueva unidad creada para coordinar iniciativas de e-learning en toda la Universidad. Estamos comenzando nuestra operación y tenemos muchas soluciones que probar e ideas que desarrollar.
Buscamos memoristas (o alumnos en práctica o alumnos que quieran trabajar part-time). Buscamos alumnos inquietos e innovadores, con interés en incorporarse a nuestro equipo, con ganas de aprender sobre las herramientas y tecnologías disponibles, y sobre los requerimientos de las áreas de enseñanza-aprendizaje, para construir en conjunto la mejor plataforma de e-learning que la Universidad podría tener.
Ofrecemos:
- Temas para todos los gustos, desde desarrollo hasta data science, pasando por operaciones y gestión de proyectos.
- Posibilidad de trabajar en remoto o presencialmente.
- Café ilimitado.
- Posible remuneración.
Algunos ejemplos de temas de memoria:
- Objetivo: Desarrollo y/o mejora de herramientas pedagógicas online
- Contacto: Cecilia Cristina Saint-Pierre (csaintpierre@uchile.cl)
- Profesor Guia: Nelson Baloian (nbaloian@dcc.uchile.cl)
- Descripción: La plataforma EOL cuenta con funcionalidades propias de openedx, algunas soportadas y otras creadas por la comunidad de desarrollo que no cuentan con soporte. Entre estas funcionalidades, estructuradas como módulos de la aplicación, hay algunas que podrían ser mejoradas, como el módulo de evaluación entre pares, y algunas que no existen y sería necesario desarrollarlas para ser integradas a la plataforma, como por ejemplo: chat, video-conferencia y consultas al equipo docente. El objetivo de esta memoria sería identificar requerimientos de los usuarios sobre funcionalidades necesarias, priorizar y desarrollar/mejorar módulos necesarios para eso.
- Objetivo: Desarrollo de un bot de ayuda online para la plataforma.
- Contacto: Cecilia Cristina Saint-Pierre (csaintpierre@uchile.cl)
- Descripción: Muchas de las dudas que llegan a la mesa de ayuda son sobre acceso, específicamente “se me bloqueó el acceso por demasiados intentos” y “mi clave no funciona y estoy seguro de que es esa”. El objetivo de esta memoria es desarrollar un bot que pueda responder automáticamente a requerimientos de ese tipo y que pueda escalar a la mesa de ayuda los requerimientos más complejos de acuerdo al tema de éste.
- Objetivo: Instalar módulo de learning analytics de openedx y mejorarlo incorporando estadísticas solicitadas por académicos.
- Contacto: Cecilia Cristina Saint-Pierre (csaintpierre@uchile.cl)
- Profesor Guia: Nelson Baloian (nbaloian@dcc.uchile.cl)
- Descripción: Openedx cuenta con un módulo de estadísticas (Insight) que en base a los registros del sistema genera estadísticas que pueden ser visualizadas por los académicos de forma gráfica. Se requiere la configuración de una nueva máquina, instalación y configuración del módulo insight y la incorporación de otras estadísticas que deben ser obtenidas de los logs que han sido requeridas frecuentemente por los académicos.
- Objetivo: Implementación de integración continua para plataforma openedx.
- Contacto: Cecilia Cristina Saint-Pierre (csaintpierre@uchile.cl)
- Profesor Guía: Javier Bustos (jbustos@niclabs.cl)
- Descripción: Actualmente el despliegue de cambios realizados a la plataforma se realiza de manera manual, lo que puede producir errores accidentales y afectar de manera directa a los usuarios de la plataforma (estudiantes y académicos). El objetivo de esta memoria es implementar un sistema de integración continua que permita realizar el despliegue automático de los cambios implementados por los desarrolladores, utilizando métodos tales como Blue-Green Deployment, Continuous Integration y manejo de secretos.
- Objetivo: Monitoreo de operación de plataforma EOL.
- Contacto: Cecilia Cristina Saint-Pierre (csaintpierre@uchile.cl)
- Profesor Guía: Javier Bustos (jbustos@niclabs.cl) *
- Descripción: Para EOL, como plataforma online, es indispensable contar con un proceso de monitoreo continuo sobre las diferentes aplicaciones, detectando y alertando sobre posibles errores que puedan ocurrir. Esta memoria consiste en implementar un proceso de monitoreo, desarrollando un proceso para la obtención, almacenamiento, visualización y alerta de las diferentes aplicaciones que se encuentran en la plataforma, permitiendo a los administradores actuar de la manera más rápida posible sobre problemas que puedan encontrarse, con la mayor cantidad de información posible.
Contexto: Entre los proyectos estratégicos de la Dirección de Servicios de Tecnologías de Información y Comunicaciones (DSTI) de la Universidad de Chile está el proveer una infraestructura de red y acceso a Internet de calidad para todas las unidades de la Universidad. Esto se ha traducido en grandes inversiones en equipamiento, fibra óptica entre los campus universitarios y ancho de banda internacional. Sin embargo, los anchos de banda logrados de extremo a extremo, bajando archivos grandes, no cumplen las expectativas originales. Varias aplicaciones académicas requieren intercambiar archivos de datos grandes (astronomía, biología, big-data, etc) y mejorar la performance estas conexiones es fundamental. Esta memoria busca ayudar a entender este problema.
Áreas de interés
Aquí se enumeran algunas áreas de interés en las cuales hay algunos profesores interesados y el tema concreto queda por ser definido:
- Temática: Cambio climático
- Contacto: Alberto de la Fuente (aldelafu@ing.uchile.cl), Departamento de Ingeniería Civil.
- Descripción: Queremos ofrecer un tema de memoria en la temática del cambio climático, en donde todo el mundo suma, y mientras mayor sea la diversidad de enfoques, mejores serán las soluciones. El enfoque del DCC es entonces fundamental, y la memoria tendría como objetivo hacer primero un diagnóstico, ver cómo se ha abordado el tema desde el punto de vista de la Computación en otros lados del mundo, y avanzar en propuestas bien desarrolladas de cómo podrían plantearse estos temas en el DCC.
Temas Adoptados
Aquí en otra sección de la wiki hay una lista de temas de la wiki que hayan sido tomados.
Preguntas Frecuentes
(Trabajo en progreso)
- ¿Qué es una memoria? Ver aquí.
- ¿Qué significa el “E” y el “F”?
- El “E” es el curso CC6908: Introducción al Trabajo de Título (antiguamente tenía el código CC69E); en el “E” hay que encontrar un tema, escribir una propuesta, y escribir un informe final con un avance en el trabajo. Tipicamente hay dos clases presenciales asociados con el “E” en las cuales se explicarán el proceso de titulación y los informes que hay que entregar; se publicarán notificaciones en el foro antes de cada clase.
- El “F” es el curso CC6909: Trabajo de Título (antiguamente tenía el código CC69F); en el “F” hay que realizar el trabajo planteado anteriormente y entregar el informe final de la memoria.
- ¿Quién puede guiar una memoria? Una memoria puede ser guiado por un profesor del DCC (siendo Academico Jornada Completa (AJC), Academico Jornada Parcial (AJP) o Profesor Externo Experto (PEX)). Puede ser guiado también por un profesor de otro departamento de la FCFM con un profesor co-guía del DCC. Una persona sin nombramiento como profesor en la FCFM puede ser nombrada oficialmente como co-guía de la tesis si es un profesional de informática o del dominio de aplicación de la memoria; en este caso su CV tiene que ser aprobado por una comisión de la Escuela.
- ¿Cómo se calcula la nota de titulación? (Artículo 69°) La nota de titulación se calcula como:
- 2/3 nota de presentación: corresponde a todos los ramos electivos y obligatorios de 5° y 6° año, excluyendo los cursos de titulación (CC6908, CC6909).
- 1/3 nota de examen de título: corresponde a la nota que los profesores de la comisión eligen después de la defensa de la memoria.
- ¿Cuántos créditos puedo cursar en paralelo con el curso CC6909 (el “F”)? (Artículo 64°) 9 créditos / 15 UDs. La única excepción es la Práctica II, que en general, no cuenta como parte del límite de créditos (antiguamente las prácticas tenían 0 créditos); en los años pasados hubo que hacer una solicitud al CAD para pedir autorización para hacer la Práctica II y el “F” en paralelo, pero ahora la autorización debería ser automática.
- ¿Puedo aprobar el “E” y postergar el “F”? Sí, se puede, pero se recomienda hablar con el profesor guía antes.
- ¿Qué es la vía rápida? ¿Cómo funciona? Para tomar la vía rápida, hay que inscribirse en el “E”. Luego, en la primera semana del “E” se puede entregar el informe final del “E”, y de ser aprobado, puedes seguir directamente al “F” en la segunda semana de clases del mismo semestre. Se debería mandar un correo al coordinador de titulación (o Angélica) para confirmar la fecha limite exacta de la entrega del informe final en la primera semana. Para poder inscribirse en el “E”, no puedes estar activo en un curso previo del “E” o del “F”; si todavía estás en el “F” sin nota, por ejemplo, habría que pedir a Angelica que se pone un “R” para ese curso.
- ¿Tengo que hacer el “E”? O si ya me encuentro trabajando en un tema, ¿puedo pasar directamente al “F”? Se puede tomar “la vía rápida” (ver la pregunta previa).
- ¿Qué pasa si repruebo el “E”? Puedes tomar la vía rápida (ver la pregunta previa) y de esta forma, no perder un semestre. O si prefieres, puedes tomar el “E” de nuevo.
- ¿Qué pasa si repruebo el “F”? Repruebas también el “E” retroactivamente, pero puedes pensar en tomar la vía rápida para hacer el “E” y el “F” juntos en el próximo semestre.
- ¿Hay algunas restricciones sobre la propiedad intelectual del trabajo? Por defecto, la propiedad intelectual del trabajo es del alumno.
- ¿Se puede hacer una memoria en un tema confidencial? Una memoria puede usar, p.ej., datos confidenciales sin problema, suponiendo que el trabajo pueda ser descrito en el informe final de forma adecuada sin publicar los datos ni perjudicar su confidencialidad. Cuando el informe de la memoria, en sí, tenga que incluir contenido confidencial, en casos excepcionales -y con suficiente justificación- se puede pedir la postergación de la publicación de una parte de la memoria por un periodo de 2 años; solo el Decano puede autorizar tal postergación. En otras situaciones excepcionales, se puede pedir una mayor postergación de su publicación (nunca superior a 5 años), o que la postergación aplica a la totalidad de la tesis. La petición al Decano requiere de una carta escrita por el Profesor Guía, con la autorización del Jefe Docente y el Coordinador de Titulación del DCC, y (luego) del Director de la Escuela de Ingeniería y Ciencias. En resumen, solo en casos excepcionales debería requerir confidencialidad el informe final de una memoria.
- ¿Qué significa una doble titulación? Hay dos formas principales de doble titulación: se puede obtener un título profesional con dos especialidades, o se puede obtener el título profesional en conjunto con un magíster. Se pueden encontrar las normas aquí.
- ¿Quién define las comisiones? El Coordinador de Titulación (el profesor del 'E') define los miembros externos (que no sean profe guía/co-guía) de las comisiones aproximadamente un mes antes de la entrega de las memorias.
- ¿Cómo funcionan las prórrogas de entrega de la memoria? Si piensas que no va a ser factible entregar la memoria dentro del plazo, se puede postular para tener una prórroga. El plazo para pedir una prórroga normalmente termina un par de semanas antes del plazo para entregar la memoria (se puede consultar la fecha acá en el calendario XX6909). El primer paso sería hablar con tu profe guía para tener su visto bueno para la prórroga. Hay que postular en ucampus en Workflow. En general el sistema abre una semana antes del fin del plazo de la postulación. En la postulación tendrán que escribir algo conciso con: (1) la justificación de la prórroga, es decir, a grandes rasgos, las complicaciones que han sugerido en el trabajo o en tu capacidad/disponibilidad para hacer el trabajo; (2) un resumen de lo que has hecho hasta el momento en términos del plan de trabajo; (3) una justificación de que sea factible terminar el trabajo dentro del plazo extendido. Cada punto puede ser un párrafo, por ejemplo. Luego el profe guía recibirá una notificación y tendrá la opción de dar su visto bueno (o no) usando ucampus. Aparte de la justificación (punto (1)), los puntos (2)+(3) son importantes, porque el riesgo es que uno pida una prórroga, pero no haya hecho mucho hasta el momento, y realmente no sea factible terminar el trabajo dentro del plazo extendido. De esa forma tendría más sentido buscar otra opción en vez de extender “lo inevitable”. Entonces es importante haber hecho algo y justificar que sea factible terminar el resto del trabajo con el plazo adicional. Con respecto a los plazos adicionales, uno puede pedir 4 semanas u 8 semanas adicionales. (El mes de febrero no está incluido, es decir que no cuenta en el plazo; da un mes adicional.)
- ¿Cuánto tiempo tendré para la charla de mi defensa? La charla de defensa de memoria debería tomar entre 20-25 minutos.
- ¿Mis amigos, padres, etc., pueden asistir a la defensa? Si la defensa se hace por zoom, hay que pedir el permiso del presidente de la comisión.
- ¿Se puede escribir la memoria en inglés? Sí. Pero la memoria tiene que incluir una traducción del resumen en castellano. También los profesores guías tendrán que preparar una carta breve solicitando permiso del Secretario de Estudios, justificando la decisión de entregar la memoria en inglés (un tramite que es más o menos simple, pero necesario igual). Se puede coordinar este tramite con Angelica/Sandra del DCC.
- ¿Dónde puedo encontrar las fechas para …? En los calendarios de la facultad acá y/o en ucampus. Los plazos pueden ser diferentes en el caso del 'E' porque la forma de evaluar los documentos en el DCC es diferente; en el caso del 'E', mejor consultar las fechas en las clases y/o en el foro del curso en u-cursos. En el 'F', las fechas son las mismas que en el calendario. Ucampus debería proveer fechas “personalizadas” en casos de prórrogas, etc.
- ¿Cómo puedo resolver mi duda sobre …? Si tiene que ver con las fechas de algo, ver la pregunta previa. Si tiene que ver con algo administrativo, primero revisar ucampus, y luego hablar con Angelica/Sandra del DCC. Si tiene que ver con el tema de memoria particular, hablar con el/la profesor(a) guía. Si tiene que ver con algo acádemico más allá de un tema, u otro asunto no mencionado acá, hablar con el Coordinador de Titulación (actualmente Aidan).