Подтвердить что ты не робот

Проверить, соответствует ли строка шаблону IP-адреса в python?

Каков самый быстрый способ проверить, соответствует ли строка определенному шаблону? Является ли regex лучшим способом?

Например, у меня есть группа строк и вы хотите проверить каждый из них, чтобы узнать, являются ли они действительным IP-адресом (действительный в этом случае означает правильный формат), является ли самый быстрый способ сделать это с помощью регулярного выражения? Или есть что-то быстрее с форматированием строки или чем-то еще.

Что-то вроде этого - то, что я делал до сих пор:

for st in strs:
    if re.match('\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}', st) != None:
       print 'IP!'
4b9b3361

Ответ 1

Похоже, вы пытаетесь проверить IP-адреса. Регулярное выражение, вероятно, не лучший инструмент для этого.

Если вы хотите принять все допустимые IP-адреса (включая некоторые адреса, которые вы, вероятно, даже не знали, были действительны), вы можете использовать IPy (Источник):

from IPy import IP
IP('127.0.0.1')

Если IP-адрес недействителен, он выдает исключение.

Или вы можете использовать socket (Источник):

import socket
try:
    socket.inet_aton(addr)
    # legal
except socket.error:
    # Not legal

Если вы действительно хотите только соответствовать IPv4 с 4 десятичными частями, тогда вы можете разделить на точку и проверить, что каждая часть является целым числом от 0 до 255.

def validate_ip(s):
    a = s.split('.')
    if len(a) != 4:
        return False
    for x in a:
        if not x.isdigit():
            return False
        i = int(x)
        if i < 0 or i > 255:
            return False
    return True

Обратите внимание, что ваше регулярное выражение не выполняет эту дополнительную проверку. Он принимает 999.999.999.999 как действительный адрес.

Ответ 2

Если вы используете Python3, вы можете использовать ipaddress module http://docs.python.org/py3k/library/ipaddress.html. Пример:

>>> import ipaddress

>>> ipv6 = "2001:0db8:0a0b:12f0:0000:0000:0000:0001"
>>> ipv4 = "192.168.2.10"
>>> ipv4invalid = "266.255.9.10"
>>> str = "Tay Tay"

>>> ipaddress.ip_address(ipv6)
IPv6Address('2001:db8:a0b:12f0::1')

>>> ipaddress.ip_address(ipv4)
IPv4Address('192.168.2.10')

>>> ipaddress.ip_address(ipv4invalid)
Traceback (most recent call last):
  File "<console>", line 1, in <module>
  File "/usr/lib/python3.4/ipaddress.py", line 54, in ip_address
    address)
ValueError: '266.255.9.10' does not appear to be an IPv4 or IPv6 address

>>> ipaddress.ip_address(str)
Traceback (most recent call last):
  File "<console>", line 1, in <module>
  File "/usr/lib/python3.4/ipaddress.py", line 54, in ip_address
    address)
ValueError: 'Tay Tay' does not appear to be an IPv4 or IPv6 address

Ответ 3

Обычно я один из немногих экспертов по Python, который стойко защищает регулярные выражения (у них довольно плохая репутация в сообществе Python), но это не один из таких случаев - принять (скажем) '333.444.555.666' как "IP-адрес" действительно плох, и если вам нужно выполнить больше проверок после сопоставления с RE, большая часть смысла использования RE все равно теряется. Итак, я повторяю рекомендации @Mark от всей души: IPy для универсальности и элегантности (включая поддержку IPv6, если хотите!), Строковые операции и проверки int, если вам нужен только IPv4 (но подумайте дважды об этом ограничении, а затем подумайте еще об одном - - время IPv6 имеет способ прийти -):

def isgoodipv4(s):
    pieces = s.split('.')
    if len(pieces) != 4: return False
    try: return all(0<=int(p)<256 for p in pieces)
    except ValueError: return False

Я бы предпочел сделать это, чем замысловатый RE, чтобы соответствовать только числам от 0 до 255! -)

Ответ 4

Еще одна проверка без re:

def validip(ip):
    return ip.count('.') == 3 and  all(0<=int(num)<256 for num in ip.rstrip().split('.'))

for i in ('123.233.42.12','3234.23.453.353','-2.23.24.234','1.2.3.4'):
    print i,validip(i)

Ответ 5

Установить пакет netaddr

sudo pip install netaddr

И тогда вы можете сделать это

>>> from netaddr import valid_ipv4
>>> valid_ipv4('11.1.1.2') 
True
>>> valid_ipv4('11.1.1.a')
False

Также вы создаете объект IPAddress из этой строки и намного больше операций, связанных с ip

>>> from netaddr import IPAddress
>>> ip = IPAddress('11.1.1.1')
>>> [f for f in dir(ip) if '__' not in f]
['_module', '_set_value', '_value', 'bin', 'bits', 'format', 'info', 'ipv4', 'ipv6', 'is_hostmask', 'is_ipv4_compat', 'is_ipv4_mapped', 'is_link_local', 'is_loopback', 'is_multicast', 'is_netmask', 'is_private', 'is_reserved', 'is_unicast', 'key', 'netmask_bits', 'packed', 'reverse_dns', 'sort_key', 'value', 'version', 'words']

Ответ 6

Ваше регулярное выражение не проверяет конец строки, поэтому оно будет соответствовать:

123.45.67.89abc123boogabooga

Чтобы исправить это, используйте:

'\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$'

(обратите внимание на $ в конце).

Наконец, в Python обычный стиль заключается в использовании is not None вместо != None.

Ответ 7

Если вы проверяете IP-адрес, я бы предложил следующее:

import socket

try:
    socket.inet_aton(addr)
    return True
except socket.error:
    return False

Если вы просто хотите проверить, находится ли он в правильном формате, вы хотели бы сделать это для всех правовых основ (не только нумерация базы 10).

Кроме того, только IP-адрес IPv4 (и ни один из них не является IPv6), вы можете просто посмотреть, какой действительный адрес и использовать split() (для получения отдельных компонентов IP) и int() (для типа-caste для сравнения). Быстрая ссылка на действующие правила IPv4 здесь.

Ответ 8

вы должны предварительно скомпилировать регулярное выражение, если вы его используете повторно

re_ip = re.compile('\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$')
# note the terminating $ to really match only the IPs

затем используйте

if re_ip.match(st):
    print '!IP'

но... т.е. '111.222.333.444' действительно IP?

Я бы посмотрел на библиотеки netaddr или ipaddr, можно ли их использовать для соответствия IP-адресам

Ответ 9

Для этого нам не нужен импорт. Это также работает намного быстрее

def is_valid_ip(str_ip_addr):
   """
   :return: returns true if IP is valid, else returns False
   """
   ip_blocks = str(str_ip_addr).split(".")
   if len(ip_blocks) == 4:
       for block in ip_blocks:
           # Check if number is digit, if not checked before calling this function
           if not block.isdigit():
               return False
           tmp = int(block)
           if 0 > tmp > 255:
               return False
       return True
    return False

Ответ 10

Другие ответы на регулярные выражения на этой странице будут принимать IP-адрес с номером более 255.

Это регулярное выражение избежит этой проблемы:

import re

def validate_ip(ip_str):
    reg = r"^(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.){3}([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])$"
    if re.match(reg, ip_str):
        return True
    else:
        return False

Ответ 11

Вы можете сделать это немного быстрее, скомпилировав его:

expression = re.compile('^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$')
for st in strs:
    if expression.match(st):
       print 'IP!'

Ответ 12

Я обманул и использовал комбинацию нескольких ответов, представленных другими людьми. Я думаю, что это довольно ясный и прямой фрагмент кода. ip_validation должен возвращать True или False. Также этот ответ работает только для адресов IPv4

import re
ip_match = re.match('^' + '[\.]'.join(['(\d{1,3})']*4) + '$', ip_input)
ip_validate = bool(ip_match)
if ip_validate:
    ip_validate &= all(map(lambda n: 0 <= int(n) <= 255, ip_match.groups())

Ответ 13

Очень просто проверить, действителен ли данный IP-адрес или нет в встроенной библиотеке ipaddress. Вы можете также проверить значение маски.

ip = '30.0.0.1'   #valid
#ip = '300.0.0.0/8'  #invalid
#ip = '30.0.0.0/8'   #valid
#ip = '30.0.0.1/8'   #invalid
#ip = 'fc00:da00::3402:69b1' #valid
#ip = 'fc00:da00::3402:69b1/128' #valid
#ip = 'fc00:da00::3402:69b1:33333' #invalid

if ip.find('/') > 0:
    try:
        temp2 = ipaddress.ip_network(ip)
        print('Valid IP network')        
    except ValueError:
        print('Invalid IP network, value error')
else:        
    try:
        temp2 = ipaddress.ip_address(ip)
        print('Valid IP')
    except ValueError:
        print('Invalid IP')

Примечание. Протестировано в Python 3.4.3

Ответ 14

Это работает и для адресов ipv6.

К сожалению, он работает только для python3

import ipaddress

def valid_ip(address):
    try: 
        print ipaddress.ip_address(address)
        return True
    except:
        return False

print valid_ip('10.10.20.30')
print valid_ip('2001:DB8::1')
print valid_ip('gibberish')

Ответ 15

#!/usr/bin/python
import sys
def check_ip(address):
    part=address.split(".")
    temp=True
    if len(part) != 4:
            temp=False
            return temp
    for p in part:
            if not 0<= int(p) <= 255:
                    temp=False
                    return temp
            else:
                    temp=True
    return temp
if __name__=="__main__":
    print check_ip(sys.argv[1])

Сохраните код с некоторым именем say- check_ip.py и запустите его как python check_ip.py 192.168.560.25
Примечание. -. Выше кода не выполняется для следующего IP-адреса. 023.65.029.33

Ответ 16

На Python 3.6 я думаю, что намного проще, так как модуль ipaddress уже включен:

import ipaddress

    def is_ipv4(string):
        try:
            ipaddress.IPv4Network(string)
            return True
        except ValueError:
            return False

Ответ 17

Вы можете попробовать следующее (программа может быть дополнительно оптимизирована):

path = "/abc/test1.txt"
fh = open (path, 'r')
ip_arr_tmp = []
ip_arr = []
ip_arr_invalid = []

for lines in fh.readlines():
    resp = re.search ("([0-9]+).([0-9]+).([0-9]+).([0-9]+)", lines)
    print resp

    if resp != None:
       (p1,p2,p3,p4) = [resp.group(1), resp.group(2), resp.group(3), resp.group(4)]       

       if (int(p1) < 0 or int(p2) < 0 or int(p3) < 0 or int(p4) <0):
           ip_arr_invalid.append("%s.%s.%s.%s" %(p1,p2,p3,p4))

       elif (int(p1) > 255 or int(p2) > 255 or int(p3) > 255 or int(p4) > 255):
            ip_arr_invalid.append("%s.%s.%s.%s" %(p1,p2,p3,p4))

       elif (len(p1)>3 or len(p2)>3 or len(p3)>3 or len(p4)>3):
            ip_arr_invalid.append("%s.%s.%s.%s" %(p1,p2,p3,p4))

       else:
           ip = ("%s.%s.%s.%s" %(p1,p2,p3,p4))
           ip_arr_tmp.append(ip)

print ip_arr_tmp

for item in ip_arr_tmp:
    if not item in ip_arr:
       ip_arr.append(item)

print ip_arr