Detector medi-IA es una herramienta basada en Inteligencia Artificial (IA) diseñada para ayudar a los usuarios a procesar texto en tiempo real de imágenes o videos. Gracias a tecnologías avanzadas como el Reconocimiento Óptico de Caracteres (OCR) y procesamiento de lenguaje natural, el programa puede captar textos de cualquier fuente visual y ofrecer respuestas contextualizadas, realizar consultas y exportar el historial que el usuario tiene.
El sistema consta de una interfaz web donde se puede activar y desactivar la cámara, capturar una imagen, y procesar el texto detectado en la imagen para obtener detalles sobre medicamentos (nombre comercial, nombre científico, acción farmacológica, etc.) utilizando un modelo de inteligencia artificial. Los resultados y el historial de consultas se almacenan en el localStorage
y se pueden exportar a un archivo .txt
.
- Cámara web o de dispositivo móvil, laptop.
- Navegador compatible con la API de acceso a la cámara por ejemplo:
Firefox |
Microsoft Edge |
Google Chrome |
Safari |
Brave |
- Conexión a internet estable.
- Clona este repositorio o descarga los archivos del proyecto.
- Asegúrate de tener las claves de APIS necesarias.
- Abre la carpeta del proyecto en tu IDE o editor de código preferido.
- AEjecuta el archivo
index.html
en tu navegador para visualizar.
-
Acceso a la Cámara:
- Permite al usuario activar y desactivar la cámara.
- Los usuarios pueden seleccionar entre varias cámaras disponibles.
- La cámara se muestra en tiempo real en la interfaz.
- Se puede capturar una imagen de la vista de la cámara.
-
Captura y Procesamiento de Texto:
- El texto en la imagen capturada se procesa usando OCR.
- Los resultados de OCR se muestran en la interfaz.
- Si el texto hace referencia a un medicamento, el sistema genera detalles sobre el medicamento.
-
Interacción con la IA:
- Usando la Inteligencia Artifical, el sistema proporciona respuestas detalladas sobre medicamentos.
-
Historial de Consultas:
- El historial de consultas y respuestas se guarda en el
localStorage
. - Se puede visualizar el historial de consultas previas en la interfaz.
- Se puede eliminar entradas del historial.
- El historial se puede exportar a un archivo
.txt
.
- El historial de consultas y respuestas se guarda en el
Tecnología | Descripción |
---|---|
JavaScript (Frontend) | Utilizado para la captura de imágenes, la interacción con la API de OCR, y la visualización de los resultados. |
HTML/CSS (Frontend) | Estructura y estilos para la interfaz de usuario. |
API OCR.space | Para realizar el reconocimiento óptico de caracteres en las imágenes capturadas. |
Node.js (Backend) | Para la gestión de las solicitudes API y la comunicación entre el frontend y el backend. |
emailjs (Backend) | Para el envio de mensajes a traves de correo electronico. |
Función | Descripción |
---|---|
requestCameraPermission() | Solicita permisos para acceder a la cámara. |
getCameras() | Obtiene las cámaras disponibles. |
activateCamera() | Activa la cámara seleccionada. |
deactivateCamera() | Desactiva la cámara. |
captureBtn.addEventListener() | Captura la imagen y procesa el texto usando OCR. |
model.generateContent() | Interactúa con el modelo de IA para generar respuestas relacionadas con medicamentos. |
- Activar la cámara: Haz clic en el botón de cámara para activar la cámara. Si hay varias cámaras disponibles, selecciona una de la lista desplegable.
- Capturar texto: Haz clic en el botón "Capturar texto" para tomar una foto del texto que aparece en la cámara. El texto detectado se procesará automáticamente.
- Historial de consultas: Haz clic en "Ver Historial" para revisar las consultas anteriores y sus respuestas. Puedes eliminar entradas del historial o exportarlo.
- Exportar Historial: Haz clic en "Exportar Historial" para descargar el historial de consultas y respuestas como un archivo
.txt
.
Clonar repositorio:
git clone https://github.com/Devmike117/medi-IA.git
Si deseas contribuir al proyecto, siéntete libre de hacer un fork del repositorio y enviar pull requests con tus cambios.
Tecnologías Web (Frontend y Backend):
JavaScript se utiliza para gestionar la interacción con el usuario, procesar imágenes y mostrar los resultados en tiempo real. Node.js se encarga de la gestión de solicitudes API y la comunicación entre el frontend y el backend. Estas tecnologías son ampliamente utilizadas y cuentan con un ecosistema maduro y eficiente que facilita el desarrollo de aplicaciones web interactivas.
Demanda y Potencial del Proyecto El sistema responde a una creciente necesidad de accesibilidad y rapidez en la obtención de información sobre medicamentos. En especial, su uso en dispositivos móviles y entornos de salud puede proporcionar una herramienta vital en situaciones de emergencia o consulta rápida. Esto aumenta la viabilidad comercial y social del proyecto, ya que podría tener aplicaciones directas en la medicina, farmacias y el sector sanitario.
Este proyecto está bajo la Licencia MIT - consulta el archivo LICENSE para más detalles.
Miguel GH