Merge pull request #545 from sartography/file-refactor-cleanup-743

File refactor cleanup #743
2022-05-25 16:25:03 -04:00 · 2022-05-25 16:25:03 -04:00 · 4aa753bef1
parent fe99872263 4c24fde952
commit 4aa753bef1
7 changed files with 34 additions and 59 deletions
--- a/crc/models/file.py
+++ b/crc/models/file.py
@ -80,37 +80,6 @@ class FileModel(db.Model):
    archived = db.Column(db.Boolean, default=False)


-# class DocumentModel(FileModel):
-#     ...
-
-
-class FileDataModel(db.Model):
-    # TODO: remove when the file refactor is finished
-    __tablename__ = 'file_data'
-    id = db.Column(db.Integer, primary_key=True)
-    md5_hash = db.Column(UUID(as_uuid=True), unique=False, nullable=False)
-    data = deferred(db.Column(db.LargeBinary))  # Don't load it unless you have to.
-    version = db.Column(db.Integer, default=0)
-    size = db.Column(db.Integer, default=0)
-    date_created = db.Column(db.DateTime(timezone=True), server_default=func.now())
-    file_model_id = db.Column(db.Integer, db.ForeignKey('file.id'))
-    file_model = db.relationship("FileModel", foreign_keys=[file_model_id])
-    user_uid = db.Column(db.String, db.ForeignKey('user.uid'), nullable=True)
-
-
-class OldFileModel(db.Model):
-    # TODO: remove when the file refactor is finished
-    __tablename__ = 'old_file'
-    id = db.Column(db.Integer, primary_key=True)
-    name = db.Column(db.String)
-    type = db.Column(db.Enum(FileType))
-    content_type = db.Column(db.String)
-    workflow_id = db.Column(db.Integer, db.ForeignKey('workflow.id'), nullable=True)
-    task_spec = db.Column(db.String, nullable=True)
-    irb_doc_code = db.Column(db.String, nullable=True)  # Code reference to the documents.xlsx reference file.
-    # data_stores = relationship(DataStoreModel, cascade="all,delete", backref="file")
-
-
 class File(object):
    def __init__(self):
        self.content_type = None
@ -165,15 +134,6 @@ class File(object):
        return instance


-# class DocumentModelSchema(SQLAlchemyAutoSchema):
-#     class Meta:
-#         model = DocumentModel
-#         load_instance = True
-#         include_relationships = True
-#         include_fk = True  # Includes foreign keys
-#         unknown = EXCLUDE
-
-
 class FileModelSchema(SQLAlchemyAutoSchema):
    class Meta:
        model = FileModel
@ -193,7 +153,8 @@ class FileSchema(Schema):
        unknown = INCLUDE
    url = Method("get_url")

-    def get_url(self, obj):
+    @staticmethod
+    def get_url(obj):
        token = 'not_available'
        if hasattr(obj, 'id') and obj.id is not None:
            file_url = url_for("/v1_0.crc_api_file_get_file_data_link", file_id=obj.id, _external=True)
--- a/crc/scripts/get_zipped_files.py
+++ b/crc/scripts/get_zipped_files.py
@ -44,7 +44,6 @@ class GetZippedFiles(Script):
                        for file in files:
                            zip_key_words = doc_info[file.irb_doc_code]['zip_key_words']
                            file_name = f'{study_id} {zip_key_words} {file.name}'
-                            # file_data = session.query(FileDataModel).filter(FileDataModel.file_model_id == file.id).first()
                            zfw.writestr(file_name, file.data)

                    with open(temp_file.name, mode='rb') as handle:
--- a/crc/services/email_service.py
+++ b/crc/services/email_service.py
@ -8,7 +8,6 @@ from jinja2 import Template
 from crc import app, db, mail, session

 from crc.models.email import EmailModel
-from crc.models.file import FileDataModel
 from crc.models.study import StudyModel

 from crc.services.jinja_service import JinjaService
--- a/crc/services/user_file_service.py
+++ b/crc/services/user_file_service.py
@ -5,7 +5,6 @@ import random
 import string

 import pandas as pd
-from github import Github, GithubObject, UnknownObjectException
 from uuid import UUID
 from lxml import etree

@ -15,7 +14,7 @@ from sqlalchemy.exc import IntegrityError
 from crc import session, app
 from crc.api.common import ApiError
 from crc.models.data_store import DataStoreModel
-from crc.models.file import FileType, FileDataModel, FileModel, FileModel
+from crc.models.file import FileType, FileModel
 from crc.models.workflow import WorkflowModel
 from crc.services.cache_service import cache
 from crc.services.user_service import UserService
@ -136,23 +135,12 @@ class UserFileService(object):

    @staticmethod
    def get_workflow_data_files(workflow_id=None):
-        """Returns all the FileDataModels related to a running workflow -
+        """Returns all the FileModels related to a running workflow -
        So these are the latest data files that were uploaded or generated
        that go along with this workflow.  Not related to the spec in any way"""
        file_models = UserFileService.get_files(workflow_id=workflow_id)
        return file_models

-    @staticmethod
-    def get_file_data(file_id: int, version: int = None):
-        """Returns the file data with the given version, or the lastest file, if version isn't provided."""
-        query = session.query(FileDataModel) \
-            .filter(FileDataModel.file_model_id == file_id)
-        if version:
-            query = query.filter(FileDataModel.version == version)
-        else:
-            query = query.order_by(desc(FileDataModel.date_created))
-        return query.first()
-
    @staticmethod
    def delete_file_data_stores(file_id):
        try:
--- a/migrations/versions/3489d5a6a2c0_migrate_file_data_to_document_table.py
+++ b/migrations/versions/3489d5a6a2c0_migrate_file_data_to_document_table.py
@ -9,7 +9,7 @@ from alembic import op
 import sqlalchemy as sa

 from crc.models.data_store import DataStoreModel
-from crc.models.file import OldFileModel, FileModel, FileDataModel
+from crc.models.file import FileModel  # OldFileModel, , FileDataModel



--- a/migrations/versions/546575fa21a8_file_refactor_cleanup.py
+++ b/migrations/versions/546575fa21a8_file_refactor_cleanup.py
@ -0,0 +1,28 @@
+"""file refactor cleanup
+
+Revision ID: 546575fa21a8
+Revises: ea1cd0f3d603
+Create Date: 2022-05-20 08:11:10.540804
+
+"""
+from alembic import op
+import sqlalchemy as sa
+
+
+# revision identifiers, used by Alembic.
+revision = '546575fa21a8'
+down_revision = 'ea1cd0f3d603'
+branch_labels = None
+depends_on = None
+
+
+def upgrade():
+    op.drop_constraint('document_id_key', 'data_store', type_='foreignkey')
+    op.drop_table('document')
+    op.drop_table('file_data')
+    op.drop_table('old_file')
+
+
+def downgrade():
+    # This is cleanup from file refactor. There is no downgrade.
+    pass
--- a/migrations/versions/7225d990740e_move_files_to_filesystem.py
+++ b/migrations/versions/7225d990740e_move_files_to_filesystem.py
@ -11,7 +11,7 @@ import sqlalchemy as sa

 # import crc
 from crc import app, session
-from crc.models.file import FileModel, FileModelSchema, FileDataModel, LookupFileModel, CONTENT_TYPES
+from crc.models.file import FileModel, FileModelSchema, LookupFileModel, CONTENT_TYPES  # , FileDataModel
 from crc.services.spec_file_service import SpecFileService
 from crc.services.reference_file_service import ReferenceFileService
 from crc.services.workflow_service import WorkflowService