[ensembl-dev] inconsistencies in version 99 release

Hiram Clawson hiram at soe.ucsc.edu
Thu Feb 13 20:36:39 GMT 2020


Good Afternoon:

I'm working my way through the version 99 release.
I'm curious about the situation of a number of
gene annotations that run beyond their chromosome size.
For example, in the file: Propithecus_coquereli.Pcoq_1.0.99.gtf.gz
there is a gene definition that runs off the end of
the chromosome:

ENSPCOT00000008378.1 txEnd 14532 >= chromSize 14529

I haven't finished working through the full set of 269 species in version 99,
but included below is a list of these types of warnings
I've see so far after examining 72 of the species.
I'm assuming these types of inconsistencies should be rectified ?

--Hiram


=== Bison_bison_bison.Bison_UMD1.0.99.gtf.gz
ENSBBBT00000000224.1 txEnd 5098 >= chromSize 5095
ENSBBBT00000027836.1 txEnd 1098 >= chromSize 1095
ENSBBBT00000033534.1 txEnd 892 >= chromSize 884
ENSBBBT00000028452.1 txEnd 819 >= chromSize 813
ENSBBBT00000029322.1 txEnd 720 >= chromSize 702
ENSBBBT00000029020.1 txEnd 704 >= chromSize 686
ENSBBBT00000029205.1 txEnd 683 >= chromSize 682
ENSBBBT00000029599.1 txEnd 694 >= chromSize 664
ENSBBBT00000029015.1 txEnd 681 >= chromSize 653
ENSBBBT00000028160.1 txEnd 645 >= chromSize 617
ENSBBBT00000029182.1 txEnd 618 >= chromSize 610
ENSBBBT00000029024.1 txEnd 621 >= chromSize 595
ENSBBBT00000029570.1 txEnd 589 >= chromSize 586
ENSBBBT00000033586.1 txEnd 558 >= chromSize 556
ENSBBBT00000027682.1 txEnd 538 >= chromSize 537
ENSBBBT00000028562.1 txEnd 539 >= chromSize 536
ENSBBBT00000028963.1 txEnd 547 >= chromSize 530
ENSBBBT00000033862.1 txEnd 538 >= chromSize 526
ENSBBBT00000033948.1 txEnd 523 >= chromSize 516
ENSBBBT00000028627.1 txEnd 531 >= chromSize 511
ENSBBBT00000027410.1 txEnd 518 >= chromSize 511
ENSBBBT00000028941.1 txEnd 517 >= chromSize 511
ENSBBBT00000033092.1 txEnd 526 >= chromSize 510
ENSBBBT00000033782.1 txEnd 507 >= chromSize 506
ENSBBBT00000033195.1 txEnd 529 >= chromSize 505
ENSBBBT00000028097.1 txEnd 505 >= chromSize 503
ENSBBBT00000027392.1 txEnd 503 >= chromSize 502
ENSBBBT00000033370.1 txEnd 499 >= chromSize 495
ENSBBBT00000030127.1 txEnd 505 >= chromSize 494
ENSBBBT00000029947.1 txEnd 500 >= chromSize 494
ENSBBBT00000017232.1 txEnd 509 >= chromSize 492
ENSBBBT00000017404.1 txEnd 499 >= chromSize 491
ENSBBBT00000016486.1 txEnd 495 >= chromSize 483
ENSBBBT00000017667.1 txEnd 492 >= chromSize 474
ENSBBBT00000028597.1 txEnd 462 >= chromSize 461
ENSBBBT00000029793.1 txEnd 462 >= chromSize 460
ENSBBBT00000033523.1 txEnd 467 >= chromSize 460
ENSBBBT00000029564.1 txEnd 460 >= chromSize 456
ENSBBBT00000033424.1 txEnd 459 >= chromSize 456
ENSBBBT00000027988.1 txEnd 454 >= chromSize 440
ENSBBBT00000027855.1 txEnd 441 >= chromSize 439
ENSBBBT00000017441.1 txEnd 456 >= chromSize 436
ENSBBBT00000029497.1 txEnd 437 >= chromSize 435
ENSBBBT00000028451.1 txEnd 440 >= chromSize 433
ENSBBBT00000028940.1 txEnd 454 >= chromSize 431
ENSBBBT00000016665.1 txEnd 414 >= chromSize 412
ENSBBBT00000017571.1 txEnd 411 >= chromSize 409
ENSBBBT00000033556.1 txEnd 411 >= chromSize 409
ENSBBBT00000033264.1 txEnd 426 >= chromSize 408
ENSBBBT00000017686.1 txEnd 404 >= chromSize 399
ENSBBBT00000033747.1 txEnd 404 >= chromSize 397
ENSBBBT00000017216.1 txEnd 406 >= chromSize 391
ENSBBBT00000028675.1 txEnd 392 >= chromSize 390
ENSBBBT00000029917.1 txEnd 387 >= chromSize 384
ENSBBBT00000033930.1 txEnd 387 >= chromSize 374
ENSBBBT00000030004.1 txEnd 400 >= chromSize 367
ENSBBBT00000017696.1 txEnd 368 >= chromSize 341
ENSBBBT00000030093.1 txEnd 351 >= chromSize 338
ENSBBBT00000028463.1 txEnd 332 >= chromSize 330
ENSBBBT00000027872.1 txEnd 336 >= chromSize 327
ENSBBBT00000027944.1 txEnd 345 >= chromSize 322
ENSBBBT00000028154.1 txEnd 328 >= chromSize 320
ENSBBBT00000017339.1 txEnd 306 >= chromSize 305
=== Castor_canadensis.C.can_genome_v1.0.99.gtf.gz
ENSCCNT00000035766.1 txEnd 399274 >= chromSize 399238
ENSCCNT00000020851.1 txEnd 142739 >= chromSize 142735
ENSCCNT00000009989.1 txEnd 44219 >= chromSize 44200
ENSCCNT00000023094.1 txEnd 41900 >= chromSize 41897
ENSCCNT00000029367.1 txEnd 16780 >= chromSize 16778
=== Chrysemys_picta_bellii.Chrysemys_picta_bellii-3.0.3.99.gtf.gz
ENSCPBT00000005691.1 txEnd 766 >= chromSize 727
ENSCPBT00000006187.1 txEnd 614 >= chromSize 603
=== Cynoglossus_semilaevis.Cse_v1.0.99.gtf.gz
ENSCSET00000012881.1 txEnd 221 >= chromSize 218
ENSCSET00000012889.1 txEnd 217 >= chromSize 211
=== Dipodomys_ordii.Dord_2.0.99.gtf.gz
ENSDORT00000021579.2 txEnd 43903 >= chromSize 43893
ENSDORT00000020465.2 txEnd 13704 >= chromSize 13697
ENSDORT00000034132.1 txEnd 1251 >= chromSize 1244
=== Fukomys_damarensis.DMR_v1.0.99.gtf.gz
ENSFDAT00000001669.1 txEnd 301 >= chromSize 295
ENSFDAT00000026393.1 txEnd 223 >= chromSize 221
=== Haplochromis_burtoni.AstBur1.0.99.gtf.gz
ENSHBUT00000021147.1 txEnd 1204 >= chromSize 1190
=== Jaculus_jaculus.JacJac1.0.99.gtf.gz
ENSJJAT00000007476.1 txEnd 4410 >= chromSize 4389
ENSJJAT00000002946.1 txEnd 1935 >= chromSize 1923
=== Macaca_fascicularis.Macaca_fascicularis_5.0.99.gtf.gz
ENSMFAT00000049321.1 txEnd 5011 >= chromSize 5009
=== Mandrillus_leucophaeus.Mleu.le_1.0.99.gtf.gz
ENSMLET00000030838.1 txEnd 35289 >= chromSize 35264
=== Mesocricetus_auratus.MesAur1.0.99.gtf.gz
ENSMAUT00000008954.1 txEnd 18377 >= chromSize 18369
ENSMAUT00000008838.1 txEnd 1152 >= chromSize 1150
=== Microcebus_murinus.Mmur_3.0.99.gtf.gz
ENSMICT00000068593.1 txEnd 5528 >= chromSize 5525
ENSMICT00000068583.1 txEnd 4860 >= chromSize 4858
ENSMICT00000039077.2 txEnd 4792 >= chromSize 4790
ENSMICT00000052172.2 txEnd 2742 >= chromSize 2739
ENSMICT00000049755.2 txEnd 1553 >= chromSize 1539
ENSMICT00000068718.1 txEnd 1264 >= chromSize 1261
=== Pan_paniscus.panpan1.1.99.gtf.gz
ENSPPAT00000007687.1 txEnd 2172 >= chromSize 2168
=== Pan_troglodytes.Pan_tro_3.0.99.gtf.gz
ENSPTRT00000103531.1 txEnd 10764 >= chromSize 10756
ENSPTRT00000079867.1 txEnd 1416 >= chromSize 1400
ENSPTRT00000096982.1 txEnd 1326 >= chromSize 1310
=== Poecilia_reticulata.Guppy_female_1.0_MT.99.gtf.gz
ENSPRET00000010679.1 txEnd 1748 >= chromSize 1723
=== Propithecus_coquereli.Pcoq_1.0.99.gtf.gz
ENSPCOT00000008378.1 txEnd 14532 >= chromSize 14529
=== Rhinopithecus_bieti.ASM169854v1.99.gtf.gz
ENSRBIT00000004729.1 txEnd 1295 >= chromSize 1287
ENSRBIT00000004240.1 txEnd 925 >= chromSize 896
ENSRBIT00000007958.1 txEnd 874 >= chromSize 870
ENSRBIT00000005433.1 txEnd 499 >= chromSize 496
ENSRBIT00000004757.1 txEnd 492 >= chromSize 474
=== Rhinopithecus_roxellana.Rrox_v1.99.gtf.gz
ENSRROT00000015658.1 txEnd 2904 >= chromSize 2895
ENSRROT00000003328.1 txEnd 575 >= chromSize 551
ENSRROT00000003014.1 txEnd 553 >= chromSize 550
ENSRROT00000017963.1 txEnd 425 >= chromSize 423
ENSRROT00000004422.1 txEnd 409 >= chromSize 406
ENSRROT00000005493.1 txEnd 247 >= chromSize 235
ENSRROT00000010204.1 txEnd 233 >= chromSize 229
ENSRROT00000009486.1 txEnd 223 >= chromSize 220
ENSRROT00000000177.1 txEnd 217 >= chromSize 214
=== Saimiri_boliviensis_boliviensis.SaiBol1.0.99.gtf.gz
ENSSBOT00000006176.1 txEnd 1192 >= chromSize 1189
=== Serinus_canaria.SCA1.99.gtf.gz
ENSSCAT00000001915.1 txEnd 371 >= chromSize 370
=== Carlito_syrichta.Tarsius_syrichta-2.0.1.99.gtf.gz
ENSTSYT00000036298.1 txEnd 9974 >= chromSize 9960
ENSTSYT00000025862.1 txEnd 865 >= chromSize 863
ENSTSYT00000041648.1 txEnd 480 >= chromSize 479
ENSTSYT00000046606.1 txEnd 454 >= chromSize 452
=== Ursus_maritimus.UrsMar_1.0.99.gtf.gz
ENSUMAT00000000039.1 txEnd 262 >= chromSize 259




More information about the Dev mailing list