Pobieram pliki na HTTP i wyświetlanie postępu przy użyciu URLLIB i następującego kodu - który działa dobrze:

import sys
from urllib import urlretrieve

urlretrieve('http://example.com/file.zip', '/tmp/localfile', reporthook=dlProgress)

def dlProgress(count, blockSize, totalSize):
 percent = int(count*blockSize*100/totalSize)
 sys.stdout.write("\r" + "progress" + "...%d%%" % percent)
 sys.stdout.flush()

Teraz chciałbym również ponownie uruchomić pobieranie, jeśli będzie zbyt wolno (powiedz mniej niż 1 MB w 15 sekund). Jak mogę to osiągnąć?

8
Holy Mackerel 23 sierpień 2012, 17:05

3 odpowiedzi

Najlepsza odpowiedź

To powinno działać. Oblicza rzeczywistą stawkę pobierania i przerywania, jeśli jest zbyt niski.

import sys
from urllib import urlretrieve
import time

url = "http://www.python.org/ftp/python/2.7.3/Python-2.7.3.tgz" # 14.135.620 Byte
startTime = time.time()

class TooSlowException(Exception):
  pass

def convertBToMb(bytes):
  """converts Bytes to Megabytes"""
  bytes = float(bytes)
  megabytes = bytes / 1048576
  return megabytes


def dlProgress(count, blockSize, totalSize):
  global startTime

  alreadyLoaded = count*blockSize
  timePassed = time.time() - startTime
  transferRate = convertBToMb(alreadyLoaded) / timePassed # mbytes per second
  transferRate *= 60 # mbytes per minute

  percent = int(alreadyLoaded*100/totalSize)
  sys.stdout.write("\r" + "progress" + "...%d%%" % percent)
  sys.stdout.flush()

  if transferRate < 4 and timePassed > 2: # download will be slow at the beginning, hence wait 2 seconds
    print "\ndownload too slow! retrying..."
    time.sleep(1) # let's not hammer the server
    raise TooSlowException

def main():
  try:
    urlretrieve(url, '/tmp/localfile', reporthook=dlProgress)

  except TooSlowException:
    global startTime
    startTime = time.time()
    main()

if __name__ == "__main__":
  main()
4
Codetoffel 23 sierpień 2012, 17:08

Coś takiego:

class Timeout(Exception): 
  pass 

def try_one(func,t=3):
  def timeout_handler(signum, frame):
    raise Timeout()

  old_handler = signal.signal(signal.SIGALRM, timeout_handler) 
  signal.alarm(t) # triger alarm in 3 seconds

  try: 
    t1=time.clock()
    func()
    t2=time.clock()

  except Timeout:
    print('{} timed out after {} seconds'.format(func.__name__,t))
    return None
  finally:
    signal.signal(signal.SIGALRM, old_handler) 

  signal.alarm(0)
  return t2-t1

Połączenie "try_one" z func, które chcesz mieć na czas i czas na limit czasu:

try_one(downloader,15)

Lub możesz to zrobić:

import socket
socket.setdefaulttimeout(15)
3
the wolf 23 sierpień 2012, 13:33

Holymacterel! Użyj narzędzi!

import urllib2, sys, socket, time, os

def url_tester(url = "http://www.python.org/ftp/python/2.7.3/Python-2.7.3.tgz"):
  file_name = url.split('/')[-1]
  u = urllib2.urlopen(url,None,1)   # Note the timeout to urllib2...
  file_size = int(u.info().getheaders("Content-Length")[0])
  print ("\nDownloading: {} Bytes: {:,}".format(file_name, file_size))

  with open(file_name, 'wb') as f:  
    file_size_dl = 0
    block_sz = 1024*4
    time_outs=0
    while True:  
      try:
        buffer = u.read(block_sz)
      except socket.timeout:
        if time_outs > 3:  # file has not had activity in max seconds...
          print "\n\n\nsorry -- try back later"
          os.unlink(file_name)
          raise
        else:       # start counting time outs...
          print "\nHmmm... little issue... I'll wait a couple of seconds"
          time.sleep(3)
          time_outs+=1
          continue

      if not buffer:  # end of the download       
        sys.stdout.write('\rDone!'+' '*len(status)+'\n\n')
        sys.stdout.flush()
        break

      file_size_dl += len(buffer)
      f.write(buffer)
      status = '{:20,} Bytes [{:.2%}] received'.format(file_size_dl, 
                      file_size_dl * 1.0 / file_size)
      sys.stdout.write('\r'+status)
      sys.stdout.flush()

  return file_name 

To wydrukuje status oczekiwanego. Jeśli odłączę kabel Ethernet, dostaję:

 Downloading: Python-2.7.3.tgz Bytes: 14,135,620
       827,392 Bytes [5.85%] received


sorry -- try back later

Jeśli odłączę kabel, a następnie podłącz go w mniej niż 12 sekund, dostaję:

Downloading: Python-2.7.3.tgz Bytes: 14,135,620
       716,800 Bytes [5.07%] received
Hmmm... little issue... I'll wait a couple of seconds

Hmmm... little issue... I'll wait a couple of seconds
Done! 

Plik został pomyślnie pobrany.

Widać, że Urllib2 obsługuje oba limit czasu i ponowne podłącza. Jeśli odłączyć się i pozostaniesz odłączony przez 3 * 4 sekundy == 12 sekund, będzie to czas na dobre i podnieść śmiertelny wyjątek. Można go również rozwiązać.

0
dawg 23 sierpień 2012, 17:49