I have this 16 columns file (tab separator) :
0/0;20,20 0/1;20,20 0/0;20,20 0/1;20,20 0/0;20,20 0/1;20,20 0/1;20,20 0/1;20,20 0/1;20,20 0/1;20,20 0/1;20,20 0/1;20,20 0/1;20,20 0/1;20,20 0/1;20,20 0/1;20,20
0/0;11,11 0/2;11,6 0/0;11,11 0/2;11,6 0/0;11,11 0/1;11,6 0/3;11,6 0/2;11,6 0/2;11,6 0/1;11,6 0/2;11,6 0/1;11,6 0/1;11,6 0/1;11,6 0/1;11,6 0/1;11,6
0/0;12,12 0/1;12,10 0/0;12,12 0/1;12,10 0/0;12,12 0/1;12,10 0/1;12,10 0/1;12,10 0/1;12,10 0/1;12,10 0/1;12,10 0/1;12,10 0/1;12,10 0/1;12,10 0/1;12,10 0/1;12,10
0/0;43,43 0/1;43,44 0/0;43,43 0/1;43,44 0/0;43,43 0/1;43,44 0/1;43,44 0/1;43,44 0/1;43,44 0/1;43,44 0/1;43,44 0/1;43,44 0/1;43,44 0/1;43,44 0/1;43,44 0/1;43,44
0/0;10,10 0/0;10,10 0/0;10,10 0/0;10,10 0/0;10,10 0/0;10,10 0/0;10,10 0/1;10,9 0/0;10,10 0/0;10,10 0/0;10,10 0/1;10,9 0/2;10,11 0/0;10,10 0/0;10,10 0/1;10,9
I need to remove entire lines where the value in columns $2, $4 and $6 to the end $16 are equal. I simply use :
awk -F't' '!a[$2 $4 $6 $7 $8 $9 $10 $11 $12 $13 $14 $15 $16]++' test.txt
But that still outputs all the lines. I should get only two lines, where I notice differences between the specified columns :
0/0;11,11 0/2;11,6 0/0;11,11 0/2;11,6 0/0;11,11 0/1;11,6 0/3;11,6 0/2;11,6 0/2;11,6 0/1;11,6 0/2;11,6 0/1;11,6 0/1;11,6 0/1;11,6 0/1;11,6 0/1;11,6
0/0;10,10 0/0;10,10 0/0;10,10 0/0;10,10 0/0;10,10 0/0;10,10 0/0;10,10 0/1;10,9 0/0;10,10 0/0;10,10 0/0;10,10 0/1;10,9 0/2;10,11 0/0;10,10 0/0;10,10 0/1;10,9
Any help?