Perl:
#!/usr/bin/perl
use strict;
use warnings;
my $in;
my $data;
my @array;
my $array;
open $in, '<', "Genomteil.gff" or die $!;
while ($data = <$in>) {
@array = split(/\t/, $data);
# w = word character [A-z, 0-9]
# W = non word charcter
# * = must occour 0 or more times
# d = same as [0-9]
# + = 1 or more times
my $GeneID = $1 if ($array [8] =~ /\w+\W+;db_xref=GeneID:(\d+)\n/) print $1;
};
close $in;
=~ hab ich jetzt zusammen.
Beispieldaten:
NC_014171.1 RefSeq gene 283 1623 . + . ID=NC_014171.1:dnaA;locus_tag=BMB171_C0001;db_xref=GeneID:9196130
NC_014171.1 RefSeq gene 1802 2947 . + . ID=NC_014171.1:dnaN1;locus_tag=BMB171_C0002;db_xref=GeneID:9191043
Gruß