Ищу python разработчика для написания прокси-чекера

asdasd · Dec 19, 2023

Всем привет. Ищу грамотно программиста,который напишет быстрый(асинхронный код) для чека большого количества проксей.
Писать только людям ,кто в теме и понимает как сделать высокую скорость чека,т.к. количество проксей от 10кк
Контакты в ПМ.

babyjo · Dec 19, 2023

Крайне не советую, неадекват, написал мне в телегу
Написал ему что могу реализовать на aiohttp , asyncio
Начал говорить что я бездарь школьник и пошел бы я ***
Его телега @mandarain
Вложения
Screenshot 2023-12-27 at 10.59.33 AM.png

renamer12 · Dec 27, 2023

Faker1231 сказал(а):
Крайне не советую, неадекват, написал мне в телегу
Написал ему что могу реализовать на aiohttp , asyncio
Начал говорить что я бездарь школьник и пошел бы я ***
Его телега @mandarain

Ты когда пустой скрин отправляешь, какой реакции ждёшь ?

asdasd · Dec 27, 2023

renamer12 сказал(а):
Ты когда пустой скрин отправляешь, какой реакции ждёшь ?

он наркоман

Чел думал.что я ему буду деньги вперед закидывать без гаранта и тд ,просто за то что,он мне написал
После того как я его спросил несколько элементарных вопросов,а он кроме 2 слов больше ничего сказать не смог,стало все понятно)

Chu Feng · Dec 27, 2023

Если не секрет , почему именно на питоне нужно ?)

asdasd · Dec 28, 2023

Chu Feng сказал(а):
Если не секрет , почему именно на питоне нужно ?)

потому что на нем получится достичь оптимальной скорости.

johnsmcsilver · Dec 28, 2023

asdasd сказал(а):
потому что на нем получится достичь оптимальной скорости.

Так а в чем тут питон выигрывает у того же go например?
В любом случае код упирается в I/O и в ядра. Потоков наплодить можно хоть сразу 10кк - да только больше времени потратится на переключении контекста.
Тут запускать в N-1 потоков (где N количество ядер), ограничивать таймаутами да и все наверное, чтение\запись в файл копейки во времени по сравнению со всем остальным, остальной код и того меньше.
Куда уже быстрее ¯\_(ツ)_/¯
А дальше если ускорять, то докупкой доп серверов

Chu Feng · Dec 28, 2023

asdasd сказал(а):
потому что на нем получится достичь оптимальной скорости.

Я конечно не пишу на питоне но насколько знаю питон это не про скорость работы а про скорость написания кода )
Ну хозяин - барин как говориться .

asdasd · Dec 28, 2023

johnsmcsilver сказал(а):
Так а в чем тут питон выигрывает у того же go например?
В любом случае код упирается в I/O и в ядра. Потоков наплодить можно хоть сразу 10кк - да только больше времени потратится на переключении контекста.
Тут запускать в N-1 потоков (где N количество ядер), ограничивать таймаутами да и все наверное, чтение\запись в файл копейки во времени по сравнению со всем остальным, остальной код и того меньше.
Куда уже быстрее ¯\_(ツ)_/¯
А дальше если ускорять, то докупкой доп серверов

можно на "go" ты прав

Ar3s · Dec 28, 2023

Исходный код
Автор - я. Писал от скуки несколько недель назад. Доработай напильником и будет тебе чекер.
Асинхронный, но не очень быстрый (питон это действительно не про скорость). И суть здесь не в ресурсах системы, а в таймауте ответа. Можно дать 3 секунды на соединение, а можно 10. И каждый невалидный проксик заблочит тебе поток на указанное количество секунд.
Последнее редактирование: 18.01.2024

Adamantiy · Jan 10, 2024

У меня есть готовое решение и на Go и на Python. Если нужно, обращайся.

leek · Jan 10, 2024

rand сказал(а):
Вы вернулись. Супер.
Вот еще как пример асинхронного чекера с применением модуля asyncio и aiohttp.
Если потребуется что-то добавить, отпишите.
Python:
Скопировать в буфер обмена
import asyncio
from sys import argv

import aiohttp

proxy_type
test_url
timeout_sec

HEADER
OKBLUE
OKGREEN
WARNING
FAIL
ENDC
BOLD
UNDERLINE

filename argv
proxylistfile filename
proxyList proxylistfilereadsplitlines

ipport

session aiohttpClientSession
resp sessiongettest_url proxyipport timeouttimeout_sec
respheaders

bcolorsOKBLUE ipport bcolorsENDC
sessionclose

sessionclose
bcolorsFAIL ipport bcolorsENDC

tasks = []

loop = asyncio.get_event_loop()

for item in proxyList:
tasks.append(asyncio.ensure_future(is_bad_proxy("http://" + item)))

print(bcolors.HEADER + "Starting... \n" + bcolors.ENDC)
loop.run_until_complete(asyncio.wait(tasks))
print(bcolors.HEADER + "\n...Finished" + bcolors.ENDC)
loop.close()
Нажмите, чтобы раскрыть...

Интересный код. Вот еще одна реализация, но быстрее:

import aiohttp
import asyncio
import ipaddress
from itertools import islice
from random import randint, sample

class Colors:
HEADER = '\033[95m'
OKBLUE = '\033[94m'
FAIL = '\033[91m'
ENDC = '\033[0m'

async def check_proxy(session, ip, port, protocol, timeout_sec, print_lock):
url = f"{protocol}://{ip}:{port}"
start_time = asyncio.get_event_loop().time()

try:
async with session.get("http://google.com", proxy=url, timeout=timeout_sec) as response:
response.raise_for_status()
elapsed_time = asyncio.get_event_loop().time() - start_time
async with print_lock:
print(f"{Colors.OKBLUE}Прокси {url} работает. Время ответа: {elapsed_time:.2f} секунд{Colors.ENDC}", flush=True)

except asyncio.TimeoutError:
elapsed_time = asyncio.get_event_loop().time() - start_time
async with print_lock:
print(f"{Colors.FAIL}Прокси {url} превысило время ожидания. Время ответа: {elapsed_time:.2f} секунд (Тайм-аут){Colors.ENDC}", flush=True)

except aiohttp.ClientError as e:
elapsed_time = asyncio.get_event_loop().time() - start_time
async with print_lock:
print(f"{Colors.FAIL}Прокси {url} не работает. Ошибка: {e}. Время ответа: {elapsed_time:.2f} секунд{Colors.ENDC}", flush=True)

async def generate_proxy_list(num_proxies, filename):
ip_network = ipaddress.IPv4Network("192.168.0.0/16")
all_ips = [ip for ip in islice(ip_network.hosts(), 1, None)]
selected_ips = sample(all_ips, num_proxies)

with open(filename, 'w') as file:
for ip in selected_ips:
port = randint(80, 9000) # Исправлено: случайные порты в пределах 80-9000
file.write(f"{ip}:{port}\n")

async def process_proxy_list(session, proxy_list, timeout_sec, print_lock):
await asyncio.gather(*(check_proxy(session, *proxy, timeout_sec, print_lock) for proxy in proxy_list))

async def main():
filename = "proxy_list.txt"
num_proxies = 2000
timeout_sec = 4

# Закомментируйте, чтобы не генерировать список прокси-адресов
await generate_proxy_list(num_proxies, filename)

with open(filename, encoding='utf-8') as proxylistfile:
proxyList = [line.strip().split(':') for line in proxylistfile]

proxies = [(ip, int(port), 'http') for ip, port in proxyList]

timeout = aiohttp.ClientTimeout(total=timeout_sec)
async with aiohttp.ClientSession(timeout=timeout) as session:
print_lock = asyncio.Lock()
await process_proxy_list(session, proxies, timeout_sec, print_lock)

if __name__ == "__main__":
asyncio.run(main())

rand · Jan 18, 2024

Ar3s сказал(а):
Исходный код
Автор - я. Писал от скуки несколько недель назад. Доработай напильником и будет тебе чекер.
Асинхронный, но не очень быстрый (питон это действительно не про скорость). И суть здесь не в ресурсах системы, а в таймауте ответа. Можно дать 3 секунды на соединение, а можно 10. И каждый невалидный проксик заблочит тебе поток на указанное количество секунд.

Вы вернулись. Супер.
Вот еще как пример асинхронного чекера с применением модуля asyncio и aiohttp.
Если потребуется что-то добавить, отпишите.
Python:
Скопировать в буфер обмена
import asyncio
from sys import argv

import aiohttp

proxy_type = "http"
test_url = "http://www.google.com"
timeout_sec = 4

class bcolors:
HEADER = '\033[95m'
OKBLUE = '\033[94m'
OKGREEN = '\033[92m'
WARNING = '\033[93m'
FAIL = '\033[91m'
ENDC = '\033[0m'
BOLD = '\033[1m'
UNDERLINE = '\033[4m'

# read the list of proxy IPs in proxyList from the first Argument given
filename = argv[1]
proxylistfile = open(filename)
proxyList = proxylistfile.read().splitlines()

async def is_bad_proxy(ipport):
try:
session = aiohttp.ClientSession()
resp = await session.get(test_url, proxy=ipport, timeout=timeout_sec)
if not resp.headers["Via"]:
raise "Error"
print(bcolors.OKBLUE + "Working:", ipport + bcolors.ENDC)
session.close()
except:
session.close()
print(bcolors.FAIL + "Not Working:", ipport + bcolors.ENDC)

tasks = []

loop = asyncio.get_event_loop()

for item in proxyList:
tasks.append(asyncio.ensure_future(is_bad_proxy("http://" + item)))

print(bcolors.HEADER + "Starting... \n" + bcolors.ENDC)
loop.run_until_complete(asyncio.wait(tasks))
print(bcolors.HEADER + "\n...Finished" + bcolors.ENDC)
loop.close()
Последнее редактирование: 18.01.2024

rand · Jan 18, 2024

Python:
Скопировать в буфер обмена
import aiohttp
import asyncio
import ipaddress
from itertools import islice
from random import randint, sample

class Colors:
HEADER = '\033[95m'
OKBLUE = '\033[94m'
FAIL = '\033[91m'
ENDC = '\033[0m'

async def check_proxy(session, ip, port, protocol, timeout_sec, print_lock):
url = f"{protocol}://{ip}:{port}"
start_time = asyncio.get_event_loop().time()

try:
async with session.get("http://google.com", proxy=url, timeout=timeout_sec) as response:
response.raise_for_status()
elapsed_time = asyncio.get_event_loop().time() - start_time
async with print_lock:
print(f"{Colors.OKBLUE}Прокси {url} работает. Время ответа: {elapsed_time:.2f} секунд{Colors.ENDC}", flush=True)

except asyncio.TimeoutError:
elapsed_time = asyncio.get_event_loop().time() - start_time
async with print_lock:
print(f"{Colors.FAIL}Прокси {url} превысило время ожидания. Время ответа: {elapsed_time:.2f} секунд (Тайм-аут){Colors.ENDC}", flush=True)

except aiohttp.ClientError as e:
elapsed_time = asyncio.get_event_loop().time() - start_time
async with print_lock:
print(f"{Colors.FAIL}Прокси {url} не работает. Ошибка: {e}. Время ответа: {elapsed_time:.2f} секунд{Colors.ENDC}", flush=True)

async def generate_proxy_list(num_proxies, filename):
ip_network = ipaddress.IPv4Network("192.168.0.0/16")
all_ips = [ip for ip in islice(ip_network.hosts(), 1, None)]
selected_ips = sample(all_ips, num_proxies)

with open(filename, 'w') as file:
for ip in selected_ips:
port = randint(80, 9000) # Исправлено: случайные порты в пределах 80-9000
file.write(f"{ip}:{port}\n")

async def process_proxy_list(session, proxy_list, timeout_sec, print_lock):
await asyncio.gather(*(check_proxy(session, *proxy, timeout_sec, print_lock) for proxy in proxy_list))

async def main():
filename = "proxy_list.txt"
num_proxies = 2000
timeout_sec = 4

# Закомментируйте, чтобы не генерировать список прокси-адресов
await generate_proxy_list(num_proxies, filename)

with open(filename, encoding='utf-8') as proxylistfile:
proxyList = [line.strip().split(':') for line in proxylistfile]

proxies = [(ip, int(port), 'http') for ip, port in proxyList]

timeout = aiohttp.ClientTimeout(total=timeout_sec)
async with aiohttp.ClientSession(timeout=timeout) as session:
print_lock = asyncio.Lock()
await process_proxy_list(session, proxies, timeout_sec, print_lock)

if __name__ == "__main__":
asyncio.run(main())

P.S. Продублировал для удобства.

Bertor · Jan 18, 2024

Если речь реально идет о лямах проксей и нужна макс скорость, то я бы решал задачу так:
- сначала raw-сокетами посылаем SYN-пакеты на все пары ip

ort с определенным рейтом, и в параллельном потоке\процессе ловим прилетающие SYN+ACK (примерно так работает масскан). На выходе получаем первичный список ip

ort которые онлайн и гарантированно слушают нужный порт.
- далее по этому списку проходимся уже обычными сокетами с использованием низкоуровневого сокетного мультиплексирования (функи select/poll/epoll), т.е. устанавливаем полноценное tcp-соединение, посылаем чек-запрос, вычитываем респонс и тд.

Ar3s · Jan 19, 2024

А я бы сделал серверную часть, которая получает и хранит пары проксей. И клиентскую часть, которая запрашивает у сервера кого надо чекнуть, а затем вернуть результаты чека. При этом сервер должен отдавать пачками штук по 100 прокси.
Клиентов можно масштабировать согласно требованиям.

stooper · Jan 19, 2024

asdasd сказал(а):
потому что на нем получится достичь оптимальной скорости.

не факт. чекер на GO выигрывает.

Checked 4667304 proxies in 26232.749461s
это на 1к потоках. почти 5кк прокси за 7 часов.
если ставить 3-5к потоков, то будет в несколько раз быстрее.
питошка на таких цифрах уложит сервер аналогичной конфигурации навзничь.

Chu Feng · Jan 20, 2024

stooper сказал(а):
не факт. чекер на GO выигрывает.

Checked 4667304 proxies in 26232.749461s
это на 1к потоках. почти 5кк прокси за 7 часов.
если ставить 3-5к потоков, то будет в несколько раз быстрее.
питошка на таких цифрах уложит сервер аналогичной конфигурации навзничь.

Я не по теме конечно но объясните мне , если не сложно .
У вас 1к ядер в проце ? зачем люди создают по 300-500-1000+ потоков в брутах / чекерах ?
Может это база и я не шарю просто но вроде это так не работает -_-

ГошаМарков · Jan 30, 2024

Chu Feng сказал(а):
Я не по теме конечно но объясните мне , если не сложно .
У вас 1к ядер в проце ? зачем люди создают по 300-500-1000+ потоков в брутах / чекерах ?
Может это база и я не шарю просто но вроде это так не работает -_-

посмотри видео и все поймешь. не плохо чувак объясняет

Chu Feng · Jan 30, 2024

ГошаМарков сказал(а):
посмотри видео и все поймешь. не плохо чувак объясняет

На питоне не пишу но за асинхронность я понимаю . Мне интересно зачем создавать 1к+ потоков (именно thread)
ps: но окей , из интереса посмотрю 40 минут не осилю питона

Ищу python разработчика для написания прокси-чекера

Light Weight

Midle Weight

Light Weight

Light Weight

Midle Weight

Light Weight

Light Weight

Midle Weight

Light Weight

Midle Weight

Light Weight

Light Weight

Light Weight

Light Weight

Light Weight

Midle Weight

Midle Weight

Midle Weight

Midle Weight

Midle Weight