Skip to content

Commit 0900d71

Browse files
authored
Create readme.md
0 parents  commit 0900d71

File tree

1 file changed

+37
-0
lines changed

1 file changed

+37
-0
lines changed

readme.md

+37
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,37 @@
1+
# **Extrator de Tabelas**
2+
3+
## Descrição
4+
5+
**Extrator de Tabelas** é um script Python desenvolvido para extrair tabelas de arquivos PDF.
6+
7+
Utilizando as bibliotecas `tabula-py`, `pandas` e `jpype1`, o script processa PDFs e converte as tabelas contidas nesses documentos em ".csv", facilitando análises e manipulações posteriores.
8+
9+
## Bibliotecas Utilizadas
10+
11+
- **jpype1**: Permite a execução de código Java a partir do Python, necessária para o funcionamento do `tabula-py`.
12+
- **tabula-py**: Interface simples para a biblioteca Tabula em Java, que permite a extração de tabelas de arquivos PDF.
13+
- **pandas**: Utilizada para processar e armazenar as tabelas extraídas.
14+
15+
## Requisitos
16+
17+
Antes de executar o script, certifique-se de que as seguintes bibliotecas estão instaladas. Execute o seguinte comando para instalá-las:
18+
19+
```bash
20+
pip install tabula-py pandas jpype1
21+
```
22+
23+
Além disso, o tabula-py requer que o Java Runtime Environment (JRE) esteja instalado em seu sistema.
24+
25+
### Executando a Extração
26+
27+
Altere o diretório para o local em que consta o arquivo a ser editado e execute o script
28+
29+
As tabelas extraídas são retornadas como um arquivo ".csv" que pode ser manipulado conforme necessário.
30+
31+
## Contribuição
32+
33+
Contribuições são bem-vindas! Sinta-se à vontade para abrir issues e pull requests no repositório GitHub do projeto.
34+
35+
## Licença
36+
37+
Este projeto é licenciado sob a licença MIT. Veja o arquivo [LICENSE](LICENSE) para mais detalhes.

0 commit comments

Comments
 (0)