Home › Fóruns › Fórum Inteligência Artificial: Buscas em Textos com Python › Spyder: Funciona com alguns Crawl(s) e não funciona com um especifico
- Este tópico contém 2 respostas, 2 vozes e foi atualizado pela última vez 6 meses atrás por Denny Ceccon.
- AutorPosts
- 2 de junho de 2024 às 13:02 #45315
#Não funciona com a pagina: ‘https://www.investsite.com.br/’
import urllib3
from bs4 import BeautifulSoupdef crawl(pagina):
urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)
http=urllib3.PoolManager()
try:
dados_pagina = http.request(‘GET’, pagina)
except:
print(‘Erro abrindo pagina’ + pagina)
sopa=BeautifulSoup(dados_pagina.data, “lxml”)
links=sopa.find_all(‘a’)
for link in links:
print(str(link.contents) + “-” + str(link.get(‘href’)))crawl(‘https://www.investsite.com.br’)
2 de junho de 2024 às 13:06 #45316a url correta é: https://www.investsite.com.br
crawl(‘https://www.investsite.com.br’)
Apos ENVIAR o post, é adicionado o residuo 8#8217
- Esta resposta foi modificada 6 meses, 1 semana atrás por Jaime Renato Stone Berg.
- Esta resposta foi modificada 6 meses, 1 semana atrás por Jaime Renato Stone Berg.
3 de junho de 2024 às 10:11 #45322Olá Jaime,
Se você clicar no link que termina com esse resíduo, vai ver que retorna uma mensagem de erro dizendo que ela não existe. Esta URL está incorreta.
- AutorPosts
- Você deve fazer login para responder a este tópico.