Respostas no Fórum

Visualizando 15 posts - 316 até 330 (de 393 do total)
  • Autor
    Posts
  • em resposta a: Curso do Zero para Detecção de Objetos #32383
    Gabriel Alves
    Moderador

      Olá!

      Esse mesmo curso (Detecção de Objetos com YOLO, Darknet, OpenCV e Python) mostra como fazer tudo isso, depois dê uma olhada na grade dele.

      Mais especificamente, para saber como fazer a anotação (annotation) das suas próprias imagens veja a aula “Criação do seu dataset de imagens manualmente”. Essa aula está mais pro final do curso, mas antes disso já é mostrado detalhadamente como fazer todo o processo de conversão e criação do weights usando conjuntos de imagens já prontos. Caso deseje usar o dataset seu personalizado basta substituir as imagens usadas nas aulas por essas imagens geradas após a anotação.

      em resposta a: cannot open resource frame #31905
      Gabriel Alves
      Moderador

        Olá Nycole!

        Esse erro ocorre quando o arquivo da fonte do texto (“calibri.ttf”) não foi devidamente carregado, ou ocorreu algum problema ao ler o arquivo. Verifique se o caminho fornecido para esse arquivo está correto e se ele se encontra exatamente no diretório especificado. Caso não consiga resolver me avise e mande o seu código completo de ambas as funções (ou melhor, se possível compartilhe o seu Colab pois pode haver outra coisa interferindo).

        em resposta a: Data Augmentation #31843
        Gabriel Alves
        Moderador

          Olá Rafael!

          Sobre o data augmentation com YOLO, só um comentário antes: a minha recomendação é sempre antes tentar buscar mais imagens do seu objeto, seja buscando em datasets de imagens na internet (como o ImageNet ou Open Images Dataset), ou, se o seu objeto for muito difícil de encontrar imagens (ou até mesmo “único”),  recomenda-se tirar novas fotos – o que realmente pode ser trabalhoso. Na verdade buscar novas imagens no geral pode ser trabalhoso, mas com certeza compensa pois assim o modelo terá uma melhor acurácia e estará mais preparado para detectar o objeto em situações mais diferenciadas.

          No entanto, caso buscar mais imagens não seja uma opção, então usar Data Augmentation pode ajudar muito. O bom é que o Darknet por padrão já usa essa técnica em seu funcionamento, em algumas etapas do treinamento do modelo pra YOLOv4. Tem mais informações sobre isso nesse artigo. Porém há uma coisa que ele não faz (a princípio) e você pode querer implementar à parte, que é a transformação por rotação.

          Deixarei abaixo mais dois materiais sobre como poderia usar data augmentation em conjunto com o YOLO:

          https://medium.com/predict/data-augmentation-for-custom-object-detection-15674966e0c8

          https://colab.research.google.com/github/joheras/CLoDSA/blob/master/notebooks/CLODSA_YOLO.ipynb – Colab com código de exemplo, que mostra um modo como fazer o augmentation já no formato usado pelo YOLO (para as coordenadas das caixas delimitadoras do arquivo de anotação).

          em resposta a: padrao_data #31693
          Gabriel Alves
          Moderador

            Olá Nycole!

            Você conseguiria passar a mensagem de erro completa? Porque na verdade no seu print infelizmente falta a parte da mensagem que mostraria o erro de fato, está mostrando apenas a linha de código onde ocorreu o erro. Se puder passar a mensagem completa vou conseguir te auxiliar melhor. Mas talvez nem precise, dê uma olhada no Colab oficial da seção: https://colab.research.google.com/drive/1mS01T2ljMRsh00_gN7OQPdXFdM6urPrj?usp=sharing

            Esse código em questão está lá onde diz “Buscando informações específicas na imagem”. Eu acabei de testar aqui e executou sem problemas. Se após conferir você ver que o código da função “escreve_texto” está igual ao código da aula e mesmo assim o erro persistir então acredito que a melhor hipótese para a causa do erro seja algum problema ao ler o arquivo “calibri.ttf”, então dê uma olhada se ele foi colocado no diretório corretamente. Se mesmo assim não conseguir resolver me avise e se possível mande a mensagem de erro completa.

            em resposta a: Arquivo de exemplo aula: BÔNUS 6: Transfer Learning com VGG16 #31614
            Gabriel Alves
            Moderador

              Disponha!

              em resposta a: Não consigo usar o Cmder #31613
              Gabriel Alves
              Moderador

                Olá Diogenes!

                Para acessar um diretório você precisa colocar o comando “cd” antes de informar o nome da pasta, por isso ele dá erro de comando não reconhecido.

                Ou seja, basta digitar “cd [nome do diretório]”. Aí você escolhe se vai informar o caminho relativo ou absoluto. Se quiser saber mais sobre o cd e outros comandos sugiro dar uma olhada aqui: https://www.infowester.com/tutdos.php

                Sobre não conseguir baixar o notepad++, qual erro aparece para você?

                em resposta a: Arquivos – aula “instalação de ferramentas #31123
                Gabriel Alves
                Moderador

                  Olá Diogenes!

                  Essa versão que você se refere creio que seria do próprio OpenCV. Na verdade, o que parece é que nessas versões mais recentes realmente não ta vindo os executáveis do createsamples e traincascade dentro dessa pasta bin.

                  Até resolverem essa questão (se resolverem, pois pelo jeito foi descontinuado) eu recomendo você baixar uma versão anterior como a 3.4.6. Você pode baixar ela aqui: https://sourceforge.net/projects/opencvlibrary/files/3.4.6/opencv-3.4.6-vc14_vc15.exe/download

                  Nessa versão certamente vai ter os arquivos necessários.

                  Aí se mais tarde por algum motivo você precisar que sua aplicação use a versão 4.1, você pode usar essa versão 3.4.6 apenas para criar os cascades e utilizá-los normalmente na versão 4 (pois essa versão do OpenCV que está sendo baixado agora será para fazer o treinamento e gerar o .xml, e para executar esses cascades você pode usar qualquer versão já que não há problema de incompatibilidade entra elas quanto ao .xml). E também não haveria problema já que da para ter mais de uma versão do OpenCV instalada ao mesmo tempo.

                  em resposta a: Make usando Gitbash #31122
                  Gabriel Alves
                  Moderador

                    Olá Giovanni,

                    Por um acaso se você não fizer as modificações no arquivo Makefile ele executa a etapa seguinte normal? Ou o erro apenas ocorre caso seja feita a modificação?

                    E só pra conferir, você baixou exatamente esse repositório aqui né? => https://github.com/AlexeyAB/darknet

                    Pois tem o repositório darknet do pjreddie (que antigamente era o oficial) e que possui menos suporte.

                    Aliás, nesse repositório há um checklist com os requisitos para rodar o darknet no Windows, recomendo dar olhada também só pra conferir mesmo: https://github.com/AlexeyAB/darknet#requirements-for-windows-linux-and-macos

                    em resposta a: Treinamento Personalizado usando CMD #31121
                    Gabriel Alves
                    Moderador

                      Olá Giovanni!

                      Para executar no terminal você pode usar exatamente o mesmo comando porém sem o ! no início, já que esse ponto de exclamação é um caractere sinalizador usado para indicarmos no Colab que queremos executar o comando pelo shell.

                      em resposta a: Treinamento de objetos personalizados #31120
                      Gabriel Alves
                      Moderador

                        Olá Alex!

                        Esse gráfico chart.png é gerado apenas após concluir o primeiro ciclo de iterações, por isso que se o treinamento foi interrompido logo no início pode ser que esse .png não seja salvo (ah e sim, por padrão ele deve ser salvo no diretório principal mesmo).

                        A respeito do questionamento da base de dados, realmente é uma base relativamente grande então há suspeita disso ter acontecido devido a um problema de memória, ou seja uso excessivo dela. Recomendo reiniciar a sessão do Colab e realizar novamente o teste. Se possível, verifique nos status do Colab como está o consumo da RAM e se aparece algum alerta durante a execução.

                        Mesmo assim, eu não afirmaria que o problema é esse pois em nossos testes não tivemos esse problema mesmo lidando com bases desse tamanho, no entanto são bases diferentes e portanto condições diferentes. Aliás, já enfrentamos problemas relacionados à memória porém foi em etapas muito mais avançadas do treinamento.

                        E sobre o que você comentou do arquivo .cfg estar em outro diretório, não teria problema porém no comando usado para iniciar o treinamento você precisa colocar exatamente o caminho do arquivo correto. Sugiro fazer igual fizemos em aula até para ficar mais fácil e evitar confusão, mas se por algum motivo desejar mudar a pasta onde você coloca os arquivos relacionados ao modelo a ser treinado então certifique-se que está tudo de acordo no comando.

                        Enfim, a recomendação principal é conferir todos os parâmetros do comando, verifique se todos os arquivos estão nos devidos diretórios e inicie a execução novamente.

                        Caso o erro permaneça, vou precisar que me passe mais uma informação sobre o seu problema: isso ocorre após quanto tempo de treinamento mais ou menos? (questão de alguns segundos mesmo ou minutos?)

                        em resposta a: Dúvida Hardware para computador rodar detecção com easyOCR #30931
                        Gabriel Alves
                        Moderador

                          Olá Pedro!

                          Não tenho nenhuma GPU específica para indicar no caso do EasyOCR. No entanto, como parece que você irá utilizar também bastante o OpenCV, que possui o módulo DNN para realizar a inferência dos modelos de Deep Learning, eu sugiro escolher alguma GPU que possua compatibilidade com o OpenCV, por isso eu recomendaria fortemente você pegar algum dessas listas https://developer.nvidia.com/cuda-gpus (preferencialmente da GeForce)

                          (obs: escolha alguma GPU nessas tabelas onde o valor do Compute Capability seja maior que 5.3, pois elas possuem a compatibilidade necessária e assim você conseguirá aproveitar de fato a GPU no OpenCV).

                          Outra ideia para escolher a GPU seria testar antes no Colab o seu programa e ver se o tempo que leva para executar está satisfatório, se estiver então você pode comprar alguma das GPUs que o Colab usa (para ver qual GPU está sendo usada use o comando !nvidia-smi)

                          A proposito, caso você utilize bastante a GPU para outros projetos de deep learning eu aconselho muito ler o seguinte artigo https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning/

                           

                          • Esta resposta foi modificada 3 anos, 6 meses atrás por Gabriel Alves.
                          em resposta a: Reconhecimento de texto em imagens com muitos contornos #30928
                          Gabriel Alves
                          Moderador

                            Olá Danillo!

                            Talvez a essa altura você já esteja em outra parte do curso e tenha verificado as outras técnicas que tem disponível, caso não tenha então eu recomendaria antes isso.

                            Mas caso já tenha visto ou se quiser tentar melhorar o resultado antes disso então eu sugiro que use o resize() para aumentar o tamanho da imagem para pelo menos 150% ou 200% do tamanho da imagem original, basta alterar os parâmetros fx e fy para indicar o fator de escala desejado (nesse exemplo seria 1.5 ou 2.0, respectivamente). Isso é comentado nas aulas sobre pré-processamento, sugiro consultar a aula específica sobre Redimensionamento caso tenha dúvidas sobre como implementar. Você pode realizar esse redimensionamento logo antes de fazer o threshold.

                            Sobre a tentativa com o EAST: como é necessário redimensionar a imagem para um tamanho padrão (ex: 320×320) pode acontecer de na hora do redimensionamento apagar alguns textos, ou deixando ele indetectável pois a imagem ficou muito menor do que era antes e assim vários detalhes são perdidos, portanto o EAST não vai ter como detectar certos textos. Aliás, esse é o comportamento esperado já que sua imagem é proporcionalmente bem grande em comparação com o texto, então veja que os números aparecem bem pequenos nela. Para tentar resolver isso você pode aumentar o tamanho da imagem fornecida à rede, que por padrão deixamos 320 x 320, mas você pode ir testando com tamanhos maiores tipo pelo menos o dobro ou o triplo desse tamanho padrão (lembrando que esse tamanho da imagem deve ser multiplo de 32), sugiro você ir testando esses tamanhos.

                            • Esta resposta foi modificada 3 anos, 6 meses atrás por Gabriel Alves.
                            em resposta a: Arquivo de exemplo aula: BÔNUS 6: Transfer Learning com VGG16 #30927
                            Gabriel Alves
                            Moderador

                              Olá Druzo!

                              Verifique se você acessou exatamente o link que está na aula, que no caso é esse aqui: https://colab.research.google.com/drive/1-aw_RlIC-WsXZw-AajyqBvQHMWvxYm4d

                              as vezes dependendo de onde você acessou ele pode ter redirecionado para outra página, mas se você acessar o link exato acima (e não esse que você colocou na sua postagem) é para conseguir abrir normalmente, acabei de testar aqui na minha conta e em outros navegadores na guia anônima então a princípio ele está abrindo corretamente.

                              Se por algum motivo ainda estiver com dificuldades para acessar nos avise!

                              em resposta a: Erro no treinamento – Couldn’t open file: data/obj.names.txt #30898
                              Gabriel Alves
                              Moderador

                                Disponha, Pedro! Que bom que deu certo.

                                em resposta a: Erro no treinamento – Couldn’t open file: data/obj.names.txt #30845
                                Gabriel Alves
                                Moderador

                                  Olá Pedro!

                                  O seu arquivo obj.names na verdade não deve ser um txt, vejo que na sua mensagem de erro diz “data/obj.names.txt

                                  Ou seja, provavelmente ocorre esse erro pois o darknet espera o arquivo com extensão .names e não .txt, ou talvez porque no comando está com .txt mas o nome do arquivo não, ou vice versa (ou seja, no comando não foi referenciado o nome exato do arquivo). Então acredito que se você ajustar isso vá funcionar.

                                  Caso o problema continue mesmo assim, peço que compartilhe aqui o seu Colab pois pode ser outra coisa que esteja interferindo.

                                Visualizando 15 posts - 316 até 330 (de 393 do total)