数値のセットが与えられたら、2つのサブセットの数値の合計の差が最小になるように、数値を2つのサブセットに分割します。
これは私が持っているアイデアですが、これが正しい解決策であるかどうかはわかりません:
これは正しい解決策ですか?もっと良くできますか?
記述している問題の decision バージョンは NP-complete 問題であり、 パーティションの問題 。多くの場合、最適な、または少なくとも十分なソリューションを提供する多くの 近似 があります。
あなたが説明した簡単なアルゴリズムは、遊び場の子供たちがチームを選ぶ方法です。この 貪欲なアルゴリズム は、セット内の数値が同程度の大きさである場合に非常によく機能します。
American Scientistによる記事 The Easiest Hardest Problem は、問題の優れた分析を提供します。読んで読んでください!
いいえ、それは機能しません。多項式時間解はありません(P = NPでない限り)。最善の方法は、すべての異なるサブセットを確認することです。 subset sum problem をご覧ください。
リスト[0, 1, 5, 6]
。 {0, 5}
および{1, 6}
、ベストアンサーが実際に{0, 1, 5}
および{6}
。
組み合わせアプローチに対する組み合わせ:
import itertools as it
def min_diff_sets(data):
"""
Parameters:
- `data`: input list.
Return:
- min diff between sum of numbers in two sets
"""
if len(data) == 1:
return data[0]
s = sum(data)
# `a` is list of all possible combinations of all possible lengths (from 1
# to len(data) )
a = []
for i in range(1, len(data)):
a.extend(list(it.combinations(data, i)))
# `b` is list of all possible pairs (combinations) of all elements from `a`
b = it.combinations(a, 2)
# `c` is going to be final correct list of combinations.
# Let's apply 2 filters:
# 1. leave only pairs where: sum of all elements == sum(data)
# 2. leave only pairs where: flat list from pairs == data
c = filter(lambda x: sum(x[0])+sum(x[1])==s, b)
c = filter(lambda x: sorted([i for sub in x for i in sub])==sorted(data), c)
# `res` = [min_diff_between_sum_of_numbers_in_two_sets,
# ((set_1), (set_2))
# ]
res = sorted([(abs(sum(i[0]) - sum(i[1])), i) for i in c],
key=lambda x: x[0])
return min([i[0] for i in res])
if __== '__main__':
assert min_diff_sets([10, 10]) == 0, "1st example"
assert min_diff_sets([10]) == 10, "2nd example"
assert min_diff_sets([5, 8, 13, 27, 14]) == 3, "3rd example"
assert min_diff_sets([5, 5, 6, 5]) == 1, "4th example"
assert min_diff_sets([12, 30, 30, 32, 42, 49]) == 9, "5th example"
assert min_diff_sets([1, 1, 1, 3]) == 0, "6th example"
これは、ナップザックとサブセット合計の問題のバリエーションです。サブセット合計問題では、n個の正の整数と値kが与えられ、値がk以下であるサブセットの合計を見つける必要があります。上記の問題では配列を指定しましたが、ここでは合計がtotal_sum(配列値の合計)以下のサブセットを見つける必要があります。そのため、ナップザックアルゴリズムのバリエーションを使用して、与えられた配列値として利益を取ることにより、サブセットの合計を見つけることができます。最後の答えはtotal_sum-dp [n] [total_sum/2]です。明確に理解するには、以下のコードをご覧ください。
#include<iostream>
#include<cstdio>
using namespace std;
int main()
{
int n;
cin>>n;
int arr[n],sum=0;
for(int i=1;i<=n;i++)
cin>>arr[i],sum+=arr[i];
int temp=sum/2;
int dp[n+1][temp+2];
for(int i=0;i<=n;i++)
{
for(int j=0;j<=temp;j++)
{
if(i==0 || j==0)
dp[i][j]=0;
else if(arr[i]<=j)
dp[i][j]=max(dp[i-1][j],dp[i-1][j-arr[i]]+arr[i]);
else
{
dp[i][j]=dp[i-1][j];
}
}
}
cout<<sum-2*dp[n][temp]<<endl;
}
再帰的なアプローチは、配列のすべての値からすべての可能な合計を生成し、どのソリューションが最適かを確認することです。合計を生成するには、セット1にi番目のアイテムを含めるか、セット2に含めないでください。
時間と空間の両方の時間の複雑さはO(n * sum)です。
public class MinimumSubsetSum {
static int dp[][];
public static int minDiffSubsets(int arr[], int i, int calculatedSum, int totalSum) {
if(dp[i][calculatedSum] != -1) return dp[i][calculatedSum];
/**
* If i=0, then the sum of one subset has been calculated as we have reached the last
* element. The sum of another subset is totalSum - calculated sum. We need to return the
* difference between them.
*/
if(i == 0) {
return Math.abs((totalSum - calculatedSum) - calculatedSum);
}
//Including the ith element
int iElementIncluded = minDiffSubsets(arr, i-1, arr[i-1] + calculatedSum,
totalSum);
//Excluding the ith element
int iElementExcluded = minDiffSubsets(arr, i-1, calculatedSum, totalSum);
int res = Math.min(iElementIncluded, iElementExcluded);
dp[i][calculatedSum] = res;
return res;
}
public static void util(int arr[]) {
int totalSum = 0;
int n = arr.length;
for(Integer e : arr) totalSum += e;
dp = new int[n+1][totalSum+1];
for(int i=0; i <= n; i++)
for(int j=0; j <= totalSum; j++)
dp[i][j] = -1;
int res = minDiffSubsets(arr, n, 0, totalSum);
System.out.println("The min difference between two subset is " + res);
}
public static void main(String[] args) {
util(new int[]{3, 1, 4, 2, 2, 1});
}
}
これは、BSTを使用して解決できます。
まずarr1と言う配列をソートします
arr1の最後の要素で別のarr2の作成を開始するには(このeleをarr1から削除します)
Now:スワップが発生しなくなるまで手順を繰り返します。
サンプルJavaコード:
import Java.util.ArrayList;
import Java.util.Collections;
import Java.util.List;
/**
* Divide an array so that the difference between these 2 is min
*
* @author shaikhjamir
*
*/
public class DivideArrayForMinDiff {
/**
* Create 2 arrays and try to find the element from 2nd one so that diff is
* min than the current one
*/
private static int sum(List<Integer> arr) {
int total = 0;
for (int i = 0; i < arr.size(); i++) {
total += arr.get(i);
}
return total;
}
private static int diff(ArrayList<Integer> arr, ArrayList<Integer> arr2) {
int diff = sum(arr) - sum(arr2);
if (diff < 0)
diff = diff * -1;
return diff;
}
private static int MIN = Integer.MAX_VALUE;
private static int binarySearch(int low, int high, ArrayList<Integer> arr1, int arr2sum) {
if (low > high || low < 0)
return -1;
int mid = (low + high) / 2;
int midVal = arr1.get(mid);
int sum1 = sum(arr1);
int resultOfMoveOrg = (sum1 - midVal) - (arr2sum + midVal);
int resultOfMove = (sum1 - midVal) - (arr2sum + midVal);
if (resultOfMove < 0)
resultOfMove = resultOfMove * -1;
if (resultOfMove < MIN) {
// lets do the swap
return mid;
}
// this is positive number greater than min
// which mean we should move left
if (resultOfMoveOrg < 0) {
// 1,10, 19 ==> 30
// 100
// 20, 110 = -90
// 29, 111 = -83
return binarySearch(low, mid - 1, arr1, arr2sum);
} else {
// resultOfMoveOrg > 0
// 1,5,10, 15, 19, 20 => 70
// 21
// For 10
// 60, 31 it will be 29
// now if we move 1
// 71, 22 ==> 49
// but now if we move 20
// 50, 41 ==> 9
return binarySearch(mid + 1, high, arr1, arr2sum);
}
}
private static int findMin(ArrayList<Integer> arr1) {
ArrayList<Integer> list2 = new ArrayList<>(arr1.subList(arr1.size() - 1, arr1.size()));
arr1.remove(arr1.size() - 1);
while (true) {
int index = binarySearch(0, arr1.size(), arr1, sum(list2));
if (index != -1) {
int val = arr1.get(index);
arr1.remove(index);
list2.add(val);
Collections.sort(list2);
MIN = diff(arr1, list2);
} else {
// now try for arr2
int index2 = binarySearch(0, list2.size(), list2, sum(arr1));
if (index2 != -1) {
int val = list2.get(index2);
list2.remove(index2);
arr1.add(val);
Collections.sort(arr1);
MIN = diff(arr1, list2);
} else {
// no switch in both the cases
break;
}
}
}
System.out.println("MIN==>" + MIN);
System.out.println("arr1==>" + arr1 + ":" + sum(arr1));
System.out.println("list2==>" + list2 + ":" + sum(list2));
return 0;
}
public static void main(String args[]) {
ArrayList<Integer> org = new ArrayList<>();
org = new ArrayList<>();
org.add(1);
org.add(2);
org.add(3);
org.add(7);
org.add(8);
org.add(10);
findMin(org);
}
}
1つの小さな変更:順序を逆にします-最大数から始めて、下に進みます。これにより、エラーが最小限に抑えられます。
いいえ、アルゴリズムが間違っています。アルゴは貪欲なアプローチに従います。私はあなたのアプローチを実装しましたが、このテストケースで失敗しました: here
貪欲なアルゴリズム:
#include<bits/stdc++.h>
#define rep(i,_n) for(int i=0;i<_n;i++)
using namespace std;
#define MXN 55
int a[MXN];
int main() {
//code
int t,n,c;
cin>>t;
while(t--){
cin>>n;
rep(i,n) cin>>a[i];
sort(a, a+n);
reverse(a, a+n);
ll sum1 = 0, sum2 = 0;
rep(i,n){
cout<<a[i]<<endl;
if(sum1<=sum2)
sum1 += a[i];
else
sum2 += a[i];
}
cout<<abs(sum1-sum2)<<endl;
}
return 0;
}
テストケース:
1
8
16 14 13 13 12 10 9 3
Wrong Ans: 6
16 13 10 9
14 13 12 3
Correct Ans: 0
16 13 13 3
14 12 10 9
貪欲なアルゴリズムが失敗する理由は、現在のより大きな合計セットでより大きな要素を取得し、後でより大きな合計セットでより小さな要素を取得すると、より良い結果が得られる場合を考慮しないためです。上記のテストケースと同じように、正しい解決策では、より大きなセットに要素を含め、この差を補正するために後ではるかに小さな要素を含めることができますが、さらなる可能性を探ったり、知ることなく、常に電流の差を最小化しようとします。
正しい解決策:
ソリューションを理解するには、以下の問題をすべて理解する必要があります。
私のコード( this と同じロジック):
#include<bits/stdc++.h>
#define rep(i,_n) for(int i=0;i<_n;i++)
using namespace std;
#define MXN 55
int arr[MXN];
int dp[MXN][MXN*MXN];
int main() {
//code
int t,N,c;
cin>>t;
while(t--){
rep(i,MXN) fill(dp[i], dp[i]+MXN*MXN, 0);
cin>>N;
rep(i,N) cin>>arr[i];
int sum = accumulate(arr, arr+N, 0);
dp[0][0] = 1;
for(int i=1; i<=N; i++)
for(int j=sum; j>=0; j--)
dp[i][j] |= (dp[i-1][j] | (j>=arr[i-1] ? dp[i-1][j-arr[i-1]] : 0));
int res = sum;
for(int i=0; i<=sum/2; i++)
if(dp[N][i]) res = min(res, abs(i - (sum-i)));
cout<<res<<endl;
}
return 0;
}
サブセットを降順または昇順で並べ替えていますか?
このように考えると、配列{1、3、5、8、9、25}
分割する場合、{1,8,9} = 18 {3,5,25} = 33になります
降順でソートされた場合、はるかにうまくいくでしょう
{25,1} = 26 {9,8,5,3} = 25
したがって、ソリューションは基本的に正しいものであり、最大値を最初に取得する必要があります。
編集:tskuzzyの投稿を読んでください。鉱山は機能しません