Página: 17 | IA Expert Academy

Respostas no Fórum

Visualizando 15 posts - 241 até 255 (de 410 do total)

← 1 2 3 … 16 17 18 … 26 27 28 →

Autor
Posts
6 de janeiro de 2023 às 10:32 em resposta a: não encontrei esse notebook #38912
Gabriel Alves
Moderador
Olá Maiara,
O notebook se encontra na aba “Materiais” na primeira aula onde ele é abordado (nesse caso, na aula “Introdução” dessa mesma seção).
Segue o link abaixo:
https://colab.research.google.com/drive/12x-fvkVRo1SBUHgJ-XYSatNz2MXMYSzv?usp=sharing
6 de janeiro de 2023 às 10:11 em resposta a: Quantidade de neurônios na camada oculta #38910
Gabriel Alves
Moderador
Olá Maiara!
Existem algumas “regras gerais” para determinar um número correto de neurônios a serem usados nas camadas ocultas, por exemplo:
- deve estar entre o tamanho da camada de entrada e o tamanho da camada de saída.
- deve ser 2/3 do tamanho da camada de entrada, mais o tamanho da camada de saída.
- deve ser menor que o dobro do tamanho da camada de entrada.
Além disso, o número de neurônios necessários para a camada oculta também depende dos casos de treinamento, da complexidade dos dados que devem ser aprendidos e do tipo de funções de ativação que serão usadas.
- Esta resposta foi modificada 2 anos, 9 meses atrás por Gabriel Alves.
3 de janeiro de 2023 às 11:42 em resposta a: AttributeError: module ‘tensorflow’ has no attribute ‘placeholder’ #38832
Gabriel Alves
Moderador
Olá, dei uma analisada aqui.
Primeiramente, você pode mudar ali de: mask[rr, cc, i] = 3
para: mask[rr, cc, i] = 1
O certo seria atribuir o valor 1 ao invés de 3, caso você continue trabalhando com máscaras binárias (pois os valores só podem ser 1 ou 0)
Porém pela mensagem de erro, parece que esse problema em questão ocorre porque durante o treinamento a máscara não pôde ser carregada, o que faz ele emitir essa mensagem. Isso provavelmente ocorre porque algum ponto do polígono usado para anotação ficou fora da imagem.
Ou seja, o ponto marcado na anotação está “fora” dos limites (largura e altura máximo) da imagem, tem alguma ponto/coordenada cujo valor excede o limite máximo do eixo x (largura) ou y (altura). Isso pode ter sido devido a um bug da ferramenta de anotação, onde provavelmente para essa imagem que ocorreu o problema o objeto se encontrava bem encostado na borda da imagem, então quando foi fazer a anotação acabou pegando no limite e o programa considerou como um ponto válido embora esteja tecnicamente fora do limite da imagem, pois como pegou bem na borda alguma parte ficou “fora” da imagem, 1 pixel fora já o suficiente para ocorrer isso (e o programa não faz uma checagem posterior para certificar que o ponto não ficou fora da imagem, ele apenas gera os pontos).
Então a solução mais óbvia seria percorrer manualmente por cada amostra do dataset e ver em qual delas a máscara se encontra fora dos limites da imagem, e fazer a correção da anotação. Pela mensagem de erro (index 781 is out of bounds for axis 1 with size 781), você poderia filtrar pelas imagens de 781 px de largura ou altura e checar elas, pois sabe que é esse o tamanho limite da imagem com problema.
Porém, percorrer imagem por imagem do dataset e corrigir manualmente pode ser trabalhoso, por isso o que pode te ajudar seria programar direto em seu código para que caso o ponto da máscara exceda esse limite do tamanho da imagem então ele coloque como sendo um ponto dentro da imagem, usando a largura/altura máxima ou minima para saber onde deve colocar o ponto. Ao invés de codificar isso sozinha, encontrei um código que vai te facilitar bastante o trabalho: https://github.com/matterport/Mask_RCNN/issues/636#issuecomment-447751080
É um código que não testamos mas pelo que vimos parece funcionar, e talvez você precise fazer algum ou outro ajuste para que se adeque à sua função (mas a princípio ele deve funcionar para outra forma de anotação além dos polígonos, como é o seu caso).
30 de dezembro de 2022 às 11:58 em resposta a: AttributeError: module ‘tensorflow’ has no attribute ‘placeholder’ #38805
Gabriel Alves
Moderador
Olá Carla, quando puder mude a permissão do Colab (lá no botão Compartilhar, no canto superior direito) para que fique acessível pelo link, pois assim consigo visualizar por aqui.
27 de dezembro de 2022 às 13:06 em resposta a: Uso de BB para armazenar os dados #38799
Gabriel Alves
Moderador
Olá Carlos!
Para o caso de detecção de imagens e reconhecimento facial não temos um curso que aborde a implementação de um projeto real que use banco de dados, já que o foco se concentrou mais na implementação e exploração das abordagens em si.
Mas se deseja usar banco de dados em seu projeto, recomendo que dê uma olhada nesse vídeo aqui: https://www.youtube.com/watch?v=6gWS2CdtZrs
Ele explica bem como você pode usar seu projeto com um banco de dados.
Também sugiro ver esse material aqui, onde ele usa SQLite.
Se prefere MySQL por exemplo, também tem esse outro exemplo aqui que será bastante útil.
27 de dezembro de 2022 às 11:56 em resposta a: AttributeError: module ‘tensorflow’ has no attribute ‘placeholder’ #38798
Gabriel Alves
Moderador
Olá, fizemos a atualização do código no Colab oficial do curso, dê uma olhada: https://colab.research.google.com/drive/1CEu9aKbtM0jDZMUN2282fMwV4c-fEn5O
Lá já se encontra a linha de código necessária para deixar compatível com essas versões mais recentes do Tensorflow.
Dentro da próxima semana provavelmente colocaremos uma aula de aviso, explicando mais sobre essa mudança.
Portanto, por enquanto se baseie no código do link acima, caso encontre algum problema para executar nos avise por favor (e se possível compartilhe o seu Colab, para verificarmos por aqui).
23 de dezembro de 2022 às 11:35 em resposta a: Treinamento personalizado – balões 3 #38780
Gabriel Alves
Moderador
Olá Carla!
Se você fez a anotação com o VIA (ou outra ferramenta que retorne as anotações para essas formas no formato .json) então você pode fazer a adaptação da forma sugerida. Ou seja, ao invés de
```
rr, cc = skimage.draw.polygon(p['all_points_y'], p['all_points_x'], mask.shape)
```
vai ficar assim
```
if p['name'] == 'polygon':
  rr, cc = skimage.draw.polygon(p['all_points_y'], p['all_points_x'], mask.shape)            
elif p['name'] == 'circle':
  rr, cc = skimage.draw.circle(p['cx'], p['cy'], p['r'])
else: 
  rr, cc = skimage.draw.ellipse(p['cx'], p['cy'], p['rx'], p['ry'], rotation=np.deg2rad(p['theta']))  
```
(isso dentro do laço de repetição for i, p in enumerate(info[“polygons”]))

Caso não funcione, peço que compartilhe aqui a mensagem de erro exata que aparece para você, assim conseguimos te auxiliar melhor.
23 de dezembro de 2022 às 11:34 em resposta a: AttributeError: module ‘tensorflow’ has no attribute ‘placeholder’ #38779
Gabriel Alves
Moderador
Olá Carla!
Isso parece estar associado à mudança recente no Colab nessas 2 ultimas semanas, onde ele passou a atribuir às novas sessões uma versão do Python onde o pip não consegue baixar uma versão inferior à 2.x., que é necessário para o repositório oficial do Mask R-CNN.
Estamos analisando se há uma maneira de solucionar isso executando algumas poucas linhas de comando e assim conseguir usar a mesma versão do tensorflow, mas caso não funcione faremos uma aula contendo as mudanças de código necessárias para poder implementar a segmentação com o tensorflow 2.
Por enquanto, para rodar no Colab a segmentação com o Mask R-CNN você pode usar esse repositório auxiliar, no lugar do repositório que usamos (o github.com/matterport/Mask_RCNN), ele foi desenvolvido para ser compatível com essas novas versões. Ou, se preferir você pode seguir os passos desse artigo aqui, que explica como fazer tanto o treinamento quanto a inferência.
17 de dezembro de 2022 às 15:18 em resposta a: Como aumentar a quantidade de classes para treinamento do balloon. #38670
Gabriel Alves
Moderador
Olá Getulio!
Verifique se lá na variável class_names (que você alterou para colocar as classes do seu modelo) está assim:
class_names = [‘BG’, ‘Lata’, ‘Cigarro’]

Se estiver, então faça um teste: coloque print(r[‘class_ids’]) logo abaixo de r = resultados[0], dentro da função processa_frame (nessa parte aqui). E veja os IDs que aparecem para você após testar em uma foto onde há lata e cigarro. Tem que aparecer o ID da classe ‘lata’ e da classe ‘cigarro’, se aparecer o mesmo ID para todas as segmentações na imagem então pode ter acontecido algum problema ao definir as configurações de treinamento. No caso, você precisa certificar que lá dentro da função load_object o código fica por exemplo assim
self.add_class(“objetos”, 1, “lata”)
self.add_class(“objetos”, 2, “cigarro”)
certificando que sejam passados IDs distintos, para cada classe, no caso, 1 e 2.
17 de dezembro de 2022 às 14:37 em resposta a: Cor das imagens do dataset montado #38669
Gabriel Alves
Moderador
Olá Jardel!
Não precisa inicialmente estar em escala de cinza, mas depois convertemos para esse espaço de cor porque as funções de reconhecimento e detecção esperam uma imagem em escala de cinza, já que os algoritmos abordados no curso trabalham com imagens assim.
Se não converter antes ele vai converter dentro da função de reconhecimento. Ou seja, se você usar mais de um método que trabalhe com imagem em tons de cinza ele vai fazer a conversão mais de uma vez. Por isso que, por motivos de performance, se faz a conversão antes de passar como parâmetro (embora seja uma melhora praticamente imperceptível para nós). Pois lembrando, a imagem em escala de cinza possui menos dados e o processamento tende a demorar bem menos.
14 de dezembro de 2022 às 11:26 em resposta a: Erro em Dettecção de face pela webcan #38612
Gabriel Alves
Moderador
Olá Diogo!
Nesse caso eu recomendo instalar o OpenCV diretamente pelo Pycharm, pois evita esse tipo de problema. Para isso, vá em: File > Settings > [Selecione o projeto] (Project) e abra Project Interpreter. No lado superior direito clique em “+”. Pesquise na lupa por “opencv-contrib-python” e clique em “Install”.
Antes só verifique se a versão correta do Python está selecionada em Project Interpreter (File > Settings > [Selecione o projeto] (Project) => Project Interpreter).
Caso não funcione experimente desinstalar o OpenCV antes (através do comando pip uninstall) e instale novamente.
12 de dezembro de 2022 às 09:17 em resposta a: tensorflow #38478
Gabriel Alves
Moderador
Olá Valdemar,
Tem como sim, você pode ter ao mesmo tempo em sua máquina vários ambientes virtuais, com até mesmo versões diferentes do Python em cada uma delas, e em cada ambiente você mantém a versão desejada das bibliotecas. Você pode fazer isso através do próprio Anaconda (nas aulas de implementação no Windows é mostrado como usá-lo, mas se quiser veja aqui).
7 de dezembro de 2022 às 11:06 em resposta a: Detecção de Faces: usa-se imagem colorida ou em escala de cinza? #38243
Gabriel Alves
Moderador
Olá!
A detecção é feita em escala de cinza pois o algoritmo espera imagens assim, e além disso em escala de cinza tem menor informações e portanto o desempenho será melhor.
Se você não fizer a conversão para escala de cinza antes de passar a imagem para o cascade (ou seja, passar a imagem com canais de cor) então isso será reconhecido pelo algoritmo e essa conversão será feita em uma etapa posterior, executada pela função detectMultiScale().
Por isso que se você não fizer a conversão pode ser que obtenha diferentes resultados (mas eles tendem a ser mínimos). Isso porque a função de conversão para escala de cinza usada provavelmente difere da função de conversão interna usada pelo método que usamos para implementar o cascade, pois há uma infinidade de funções para conversão de imagens com 3 canais de cores para 1 canal de cor, como pode ser visto nesse exemplo (pode ver que dependendo da função, certas regiões podem ficar com um tom de cinza mais escuro ou mais claro. e se por exemplo a “confiança” de uma determinada detecção estiver perto do limiar então uma pequena diferença no tom de luminosidade de certas regiões pode ser um fator decisivo para que o cascade classifique ou não determinado objeto).
Mas no fim, o cascade se baseará numa versão em escala de cinza da imagem, pois eles foram treinados em escala de cinza, além de que toda a sua abordagem em si se baseia na diferença de iluminação na imagem e portanto é uma técnica que por padrão não leva em consideração tons de cores nesse caso.
Veja abaixo um artigo se quiser ver o comparativo e mais detalhes sobre as duas abordagens: https://www.researchgate.net/publication/255798161_Face_Detection_on_Grayscale_and_Color_Images_using_Combined_Cascade_of_Classifiers
E quanto ao tamanho, simplesmente não há uma regra exata. O “melhor” tamanho é escolhido com base numa avaliação entre desempenho (muito grande começa a ficar bem pesado) e também considera-se o tamanho mínimo indicado a se usar para que detalhes importantes na imagem não sejam perdidos. Por exemplo, se sua imagem contém detalhes pequenos e o cascade deve detectar esses objetos pequenos então não dá para diminuir tanto a imagem, mas você pode reduzir sim até um ponto onde o cascade seja capaz de detectar. Por isso também que reduzir ou não a imagem pode fazer com que certos objetos sejam detectados ou não, mas as vezes apenas ao redimensionar a imagem faz com que influencie a detecção de objetos que estão num tamanho “normal” – mas aí se estiver apresentando resultados incorretos então é o caso de você precisar calibrar melhor os parâmetros da função detectMultiScale().
Enfim, não há uma regra de melhor tamanho, mas seguindo essas dicas e através de testes você consegue chegar no tamanho mais adequado para a sua situação.
- Esta resposta foi modificada 2 anos, 10 meses atrás por Gabriel Alves.
6 de dezembro de 2022 às 07:22 em resposta a: Segmentação Instâncias em Vídeos #38197
Gabriel Alves
Moderador
Olá Victor!
Já estamos analisando aqui. Se possível, compartilhe o seu Colab.
Pelo que parece, tem a ver com a versão do Tensorflow, que durante a sessão não foi trocada para a 1.x. Se precisar, enquanto isso você pode usar o Mask R-CNN para a versão 2.x do Tensorflow, basta usar esse repositório ao invés do usado na aula.
30 de novembro de 2022 às 15:40 em resposta a: Fazer captura de vídeo gravado ao invés de fotos em tempo real #38159
Gabriel Alves
Moderador
Olá Jardel!
Para capturar as imagens de um vídeo basta fazer uma alteração no parâmetro da função “VideoCapture()”, lá na aula passamos o valor 0 pois corresponde ao “índice” do dispositivo de câmera a ser usado pelo OpenCV (nesse exemplo, a própria webcam), então por padrão é 0. Mas se ao invés de fazer a leitura em tempo real pela webcam você quer ler os frames de um arquivo de vídeo então basta você trocar o parâmetro, ao invés do número você vai colocar o caminho para o arquivo de vídeo
por exemplo: cv2.VideoCapture(“video1.mp4”)
onde video1.mp4 é o nome do arquivo de vídeo. E lembre de colocar o caminho correto, em relação à raiz do seu projeto (então se por exemplo o arquivo de vídeo está dentro de uma pasta chamada “videos” precisa colocar lá assim “videos/video1.mp4”).
E para capturar a cada 1 segundo, basta colocar uma condição para que ele salve a imagem somente após passar 1 segundo, ou a cada x frames por exemplo.
Autor
Posts

Visualizando 15 posts - 241 até 255 (de 410 do total)

← 1 2 3 … 16 17 18 … 26 27 28 →