Подтвердить что ты не робот

Нахождение симметричной разности с помощью LINQ

У меня есть две коллекции a и b. Я хотел бы вычислить набор элементов в a или b, но не в обоих (логический эксклюзив или). С LINQ я могу придумать следующее:

IEnumerable<T> Delta<T>(IEnumerable<T> a, IEnumerable<T> b)
{
    return a.Except (b).Union (b.Except (a));
}

Интересно, есть ли другие более эффективные или более компактные способы создания разницы между двумя коллекциями.

Изменить 1: Jon Skeet опубликовал первое решение, которое не сохраняет порядок элементов, полагаясь на HashSet. Интересно, существуют ли другие подходы, которые сохраняли бы порядок a и b в выходе.

4b9b3361

Ответ 1

Используйте HashSet<T> напрямую - он имеет метод SymmetricExceptWith:

HashSet<T> data = new HashSet<T>(a);
data.SymmetricExceptWith(b);

EDIT: Если вы хотите сохранить заказ, здесь альтернатива:

HashSet<T> data = new HashSet<T>(a);
data.IntersectWith(b);
foreach (T t in a.Concat(b))
{
    if (!data.Contains(t))
    {
        yield return t;
    }
}

Это имеет следующие важные отличия:

  • Оба a и b повторяются дважды. В некоторых случаях это может быть очень плохо - вы можете называть ToList для каждого из них, чтобы начать с сохранения буфера.
  • Если есть дубликаты в a или b, они будут выдаваться несколько раз. Если вы хотите избежать этого, вы можете сохранить набор уже полученных значений. На данный момент это будет эквивалентно:

    a.Concat(b).Except(a.Intersect(b))
    

Тем не менее, все еще только две заданные операции вместо трех в вашем исходном коде.

Ответ 2

Учитывая a.Except(b) и b.Except(a) не пересекаются, вы можете использовать concat вместо union, сохранение оператора набора (и concat более эффективно).

return a.Except (b).Concat (b.Except (a));

Это по-прежнему проходит через каждый список дважды.

Ответ 3

У нас была аналогичная потребность в проекте в моей компании, поэтому мы написали это расширение:

public class EnumerablePair<T> : IReadOnlyCollection<T>
{
    private IReadOnlyCollection<T> _Left;
    private IReadOnlyCollection<T> _Right;
    private IEnumerable<T> _Union;
    private int _Count;
    public EnumerablePair(IEnumerable<T> left, IEnumerable<T> right)
    {
        _Left = left?.ToList() ?? Enumerable.Empty<T>().ToList();
        _Right = right?.ToList() ?? Enumerable.Empty<T>().ToList();
        _Count = Left.Count + Right.Count;
        _Union = Left.Union(Right);
    }

    public int Count => _Count;
    public IReadOnlyCollection<T> Left { get => _Left; }
    public IReadOnlyCollection<T> Right { get => _Right; }

    public IEnumerator<T> GetEnumerator()
    {
        return _Union.GetEnumerator();
    }

    IEnumerator IEnumerable.GetEnumerator()
    {
        return _Union.GetEnumerator();
    }
}

public static class EnumerableExtension
{
    public static EnumerablePair<T> ExclusiveDisjunction<T>(this IEnumerable<T> leftOperand, IEnumerable<T> rightOperand, IEqualityComparer<T> comparer = null)
    {
        if (leftOperand == null)
            throw new ArgumentNullException(nameof(leftOperand), $"{nameof(leftOperand)} is null.");
        if (rightOperand == null)
            throw new ArgumentNullException(nameof(rightOperand), $"{nameof(rightOperand)} is null.");

        // TODO : Can be optimized if one of the IEnumerable parameters is empty.

        bool leftIsBigger = leftOperand.Count() > rightOperand.Count();
        var biggestOperand = leftIsBigger ? leftOperand.ToList() : rightOperand.ToList();
        var smallestOperand = leftIsBigger ? rightOperand.ToList() : leftOperand.ToList();

        var except1 = biggestOperand.ToList();
        var except2 = Enumerable.Empty<T>().ToList();

        Func<T, T, bool> areEquals;
        if (comparer != null)
            areEquals = (one, theOther) => comparer.Equals(one, theOther);
        else
            areEquals = (one, theOther) => one?.Equals(theOther) ?? theOther == null;

        foreach (T t in smallestOperand)
            if (except1.RemoveAll(item => areEquals(item, t)) == 0)
                except2.Add(t);

        if (leftIsBigger)
            return new EnumerablePair<T>(except1, except2);
        return new EnumerablePair<T>(except2, except1);
    }
}

Он сравнивает элементы двух коллекций (используя IEqualityComparer или нет, по вашему выбору).

  • Возвращаемый объект EnumerablePair<T> содержит объекты, находящиеся в leftOperand или rightOperand, но не оба (XOR).
  • EnumerablePair<T>.Left содержит объекты, находящиеся в leftOperand, но не в rightOperand.
  • EnumerablePair<T>.Right содержит объекты, находящиеся в rightOperand, но не в leftOperand.

Вы можете использовать расширение следующим образом:

var xorList = list1.ExclusiveDisjunction(list2);
var leftXor = xorList.Left;
var rightXor = xorList.Right;

xorList, leftXor и rightXor являются IEnumerable<T>.