media/filters/gpu_video_decoder.cc - chromium/src - Git at Google

 // Copyright (c) 2012 The Chromium Authors. All rights reserved.
 // Use of this source code is governed by a BSD-style license that can be
 // found in the LICENSE file.

 #include "media/filters/gpu_video_decoder.h"

 #include <algorithm>

 #include "base/bind.h"
 #include "base/callback_helpers.h"
 #include "base/command_line.h"
 #include "base/cpu.h"
 #include "base/message_loop/message_loop.h"
 #include "base/metrics/histogram.h"
 #include "base/stl_util.h"
 #include "base/synchronization/waitable_event.h"
 #include "base/task_runner_util.h"
 #include "gpu/command_buffer/common/mailbox_holder.h"
 #include "media/base/bind_to_current_loop.h"
 #include "media/base/decoder_buffer.h"
 #include "media/base/media_switches.h"
 #include "media/base/pipeline.h"
 #include "media/base/pipeline_status.h"
 #include "media/base/video_decoder_config.h"
 #include "media/filters/gpu_video_accelerator_factories.h"
 #include "third_party/skia/include/core/SkBitmap.h"

 namespace media {

 const char GpuVideoDecoder::kDecoderName[] = "GpuVideoDecoder";

 // Maximum number of concurrent VDA::Decode() operations GVD will maintain.
 // Higher values allow better pipelining in the GPU, but also require more
 // resources.
 enum { kMaxInFlightDecodes = 4 };

 // Size of shared-memory segments we allocate.  Since we reuse them we let them
 // be on the beefy side.
 static const size_t kSharedMemorySegmentBytes = 100 << 10;

 GpuVideoDecoder::SHMBuffer::SHMBuffer(base::SharedMemory* m, size_t s)
     : shm(m), size(s) {
 }

 GpuVideoDecoder::SHMBuffer::~SHMBuffer() {}

 GpuVideoDecoder::PendingDecoderBuffer::PendingDecoderBuffer(
     SHMBuffer* s,
     const scoped_refptr<DecoderBuffer>& b,
     const DecodeCB& done_cb)
     : shm_buffer(s), buffer(b), done_cb(done_cb) {
 }

 GpuVideoDecoder::PendingDecoderBuffer::~PendingDecoderBuffer() {}

 GpuVideoDecoder::BufferData::BufferData(
     int32 bbid, base::TimeDelta ts, const gfx::Rect& vr, const gfx::Size& ns)
     : bitstream_buffer_id(bbid), timestamp(ts), visible_rect(vr),
       natural_size(ns) {
 }

 GpuVideoDecoder::BufferData::~BufferData() {}

 GpuVideoDecoder::GpuVideoDecoder(
     const scoped_refptr<GpuVideoAcceleratorFactories>& factories)
     : needs_bitstream_conversion_(false),
       factories_(factories),
       state_(kNormal),
       decoder_texture_target_(0),
       next_picture_buffer_id_(0),
       next_bitstream_buffer_id_(0),
       available_pictures_(0),
       weak_factory_(this) {
   DCHECK(factories_.get());
 }

 void GpuVideoDecoder::Reset(const base::Closure& closure)  {
   DVLOG(3) << "Reset()";
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

   if (state_ == kDrainingDecoder) {
     base::MessageLoop::current()->PostTask(
         FROM_HERE,
         base::Bind(
             &GpuVideoDecoder::Reset, weak_factory_.GetWeakPtr(), closure));
     return;
   }

   if (!vda_) {
     base::MessageLoop::current()->PostTask(FROM_HERE, closure);
     return;
   }

   DCHECK(pending_reset_cb_.is_null());
   pending_reset_cb_ = BindToCurrentLoop(closure);

   vda_->Reset();
 }

 static bool IsCodedSizeSupported(const gfx::Size& coded_size) {
 #if defined(OS_WIN)
   // Windows Media Foundation H.264 decoding does not support decoding videos
   // with any dimension smaller than 48 pixels:
   // http://msdn.microsoft.com/en-us/library/windows/desktop/dd797815
   if (coded_size.width() < 48 || coded_size.height() < 48)
     return false;
 #endif

   // Only non-Windows, Ivy Bridge+ platforms can support more than 1920x1080.
   // We test against 1088 to account for 16x16 macroblocks.
   if (coded_size.width() <= 1920 && coded_size.height() <= 1088)
     return true;

   // NOTE: additional autodetection logic may require updating input buffer size
   // selection in platform-specific implementations, such as
   // V4L2VideoDecodeAccelerator.
   base::CPU cpu;
   bool hw_large_video_support =
       CommandLine::ForCurrentProcess()->HasSwitch(
           switches::kIgnoreResolutionLimitsForAcceleratedVideoDecode) ||
       ((cpu.vendor_name() == "GenuineIntel") && cpu.model() >= 55);
   bool os_large_video_support = true;
 #if defined(OS_WIN)
   os_large_video_support = false;
 #endif
   return os_large_video_support && hw_large_video_support;
 }

 // Report |status| to UMA and run |cb| with it.  This is super-specific to the
 // UMA stat reported because the UMA_HISTOGRAM_ENUMERATION API requires a
 // callsite to always be called with the same stat name (can't parameterize it).
 static void ReportGpuVideoDecoderInitializeStatusToUMAAndRunCB(
     const PipelineStatusCB& cb,
     PipelineStatus status) {
   UMA_HISTOGRAM_ENUMERATION(
       "Media.GpuVideoDecoderInitializeStatus", status, PIPELINE_STATUS_MAX + 1);
   cb.Run(status);
 }

 std::string GpuVideoDecoder::GetDisplayName() const {
   return kDecoderName;
 }

 void GpuVideoDecoder::Initialize(const VideoDecoderConfig& config,
                                  bool /* low_delay */,
                                  const PipelineStatusCB& orig_status_cb,
                                  const OutputCB& output_cb) {
   DVLOG(3) << "Initialize()";
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
   DCHECK(config.IsValidConfig());
   DCHECK(!config.is_encrypted());

   PipelineStatusCB status_cb =
       base::Bind(&ReportGpuVideoDecoderInitializeStatusToUMAAndRunCB,
                  BindToCurrentLoop(orig_status_cb));

   bool previously_initialized = config_.IsValidConfig();
   DVLOG(1) << "(Re)initializing GVD with config: "
            << config.AsHumanReadableString();

   // TODO(posciak): destroy and create a new VDA on codec/profile change
   // (http://crbug.com/260224).
   if (previously_initialized && (config_.profile() != config.profile())) {
     DVLOG(1) << "Codec or profile changed, cannot reinitialize.";
     status_cb.Run(DECODER_ERROR_NOT_SUPPORTED);
     return;
   }

   if (!IsCodedSizeSupported(config.coded_size())) {
     status_cb.Run(DECODER_ERROR_NOT_SUPPORTED);
     return;
   }

   config_ = config;
   needs_bitstream_conversion_ = (config.codec() == kCodecH264);
   output_cb_ = BindToCurrentLoop(output_cb);

   if (previously_initialized) {
     // Reinitialization with a different config (but same codec and profile).
     // VDA should handle it by detecting this in-stream by itself,
     // no need to notify it.
     status_cb.Run(PIPELINE_OK);
     return;
   }

   vda_ = factories_->CreateVideoDecodeAccelerator().Pass();
   if (!vda_ || !vda_->Initialize(config.profile(), this)) {
     status_cb.Run(DECODER_ERROR_NOT_SUPPORTED);
     return;
   }

   DVLOG(3) << "GpuVideoDecoder::Initialize() succeeded.";
   status_cb.Run(PIPELINE_OK);
 }

 void GpuVideoDecoder::DestroyPictureBuffers(PictureBufferMap* buffers) {
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
   for (PictureBufferMap::iterator it = buffers->begin(); it != buffers->end();
        ++it) {
     factories_->DeleteTexture(it->second.texture_id());
   }

   buffers->clear();
 }

 void GpuVideoDecoder::DestroyVDA() {
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

   vda_.reset();

   // Not destroying PictureBuffers in |picture_buffers_at_display_| yet, since
   // their textures may still be in use by the user of this GpuVideoDecoder.
   for (PictureBufferTextureMap::iterator it =
            picture_buffers_at_display_.begin();
        it != picture_buffers_at_display_.end();
        ++it) {
     assigned_picture_buffers_.erase(it->first);
   }
   DestroyPictureBuffers(&assigned_picture_buffers_);
 }

 void GpuVideoDecoder::Decode(const scoped_refptr<DecoderBuffer>& buffer,
                              const DecodeCB& decode_cb) {
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
   DCHECK(pending_reset_cb_.is_null());

   DecodeCB bound_decode_cb = BindToCurrentLoop(decode_cb);

   if (state_ == kError || !vda_) {
     bound_decode_cb.Run(kDecodeError);
     return;
   }

   switch (state_) {
     case kDecoderDrained:
       state_ = kNormal;
       // Fall-through.
     case kNormal:
       break;
     case kDrainingDecoder:
     case kError:
       NOTREACHED();
       return;
   }

   DCHECK_EQ(state_, kNormal);

   if (buffer->end_of_stream()) {
     state_ = kDrainingDecoder;
     eos_decode_cb_ = bound_decode_cb;
     vda_->Flush();
     return;
   }

   size_t size = buffer->data_size();
   SHMBuffer* shm_buffer = GetSHM(size);
   if (!shm_buffer) {
     bound_decode_cb.Run(kDecodeError);
     return;
   }

   memcpy(shm_buffer->shm->memory(), buffer->data(), size);
   BitstreamBuffer bitstream_buffer(
       next_bitstream_buffer_id_, shm_buffer->shm->handle(), size);
   // Mask against 30 bits, to avoid (undefined) wraparound on signed integer.
   next_bitstream_buffer_id_ = (next_bitstream_buffer_id_ + 1) & 0x3FFFFFFF;
   DCHECK(!ContainsKey(bitstream_buffers_in_decoder_, bitstream_buffer.id()));
   bitstream_buffers_in_decoder_.insert(
       std::make_pair(bitstream_buffer.id(),
                      PendingDecoderBuffer(shm_buffer, buffer, decode_cb)));
   DCHECK_LE(static_cast<int>(bitstream_buffers_in_decoder_.size()),
             kMaxInFlightDecodes);
   RecordBufferData(bitstream_buffer, *buffer.get());

   vda_->Decode(bitstream_buffer);
 }

 void GpuVideoDecoder::RecordBufferData(const BitstreamBuffer& bitstream_buffer,
                                        const DecoderBuffer& buffer) {
   input_buffer_data_.push_front(BufferData(bitstream_buffer.id(),
                                            buffer.timestamp(),
                                            config_.visible_rect(),
                                            config_.natural_size()));
   // Why this value?  Because why not.  avformat.h:MAX_REORDER_DELAY is 16, but
   // that's too small for some pathological B-frame test videos.  The cost of
   // using too-high a value is low (192 bits per extra slot).
   static const size_t kMaxInputBufferDataSize = 128;
   // Pop from the back of the list, because that's the oldest and least likely
   // to be useful in the future data.
   if (input_buffer_data_.size() > kMaxInputBufferDataSize)
     input_buffer_data_.pop_back();
 }

 void GpuVideoDecoder::GetBufferData(int32 id, base::TimeDelta* timestamp,
                                     gfx::Rect* visible_rect,
                                     gfx::Size* natural_size) {
   for (std::list<BufferData>::const_iterator it =
            input_buffer_data_.begin(); it != input_buffer_data_.end();
        ++it) {
     if (it->bitstream_buffer_id != id)
       continue;
     *timestamp = it->timestamp;
     *visible_rect = it->visible_rect;
     *natural_size = it->natural_size;
     return;
   }
   NOTREACHED() << "Missing bitstreambuffer id: " << id;
 }

 bool GpuVideoDecoder::NeedsBitstreamConversion() const {
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
   return needs_bitstream_conversion_;
 }

 bool GpuVideoDecoder::CanReadWithoutStalling() const {
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
   return
       next_picture_buffer_id_ == 0 ||  // Decode() will ProvidePictureBuffers().
       available_pictures_ > 0;
 }

 int GpuVideoDecoder::GetMaxDecodeRequests() const {
   return kMaxInFlightDecodes;
 }

 void GpuVideoDecoder::ProvidePictureBuffers(uint32 count,
                                             const gfx::Size& size,
                                             uint32 texture_target) {
   DVLOG(3) << "ProvidePictureBuffers(" << count << ", "
            << size.width() << "x" << size.height() << ")";
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

   std::vector<uint32> texture_ids;
   std::vector<gpu::Mailbox> texture_mailboxes;
   decoder_texture_target_ = texture_target;
   if (!factories_->CreateTextures(count,
                                   size,
                                   &texture_ids,
                                   &texture_mailboxes,
                                   decoder_texture_target_)) {
     NotifyError(VideoDecodeAccelerator::PLATFORM_FAILURE);
     return;
   }
   DCHECK_EQ(count, texture_ids.size());
   DCHECK_EQ(count, texture_mailboxes.size());

   if (!vda_)
     return;

   std::vector<PictureBuffer> picture_buffers;
   for (size_t i = 0; i < texture_ids.size(); ++i) {
     picture_buffers.push_back(PictureBuffer(
         next_picture_buffer_id_++, size, texture_ids[i], texture_mailboxes[i]));
     bool inserted = assigned_picture_buffers_.insert(std::make_pair(
         picture_buffers.back().id(), picture_buffers.back())).second;
     DCHECK(inserted);
   }

   available_pictures_ += count;

   vda_->AssignPictureBuffers(picture_buffers);
 }

 void GpuVideoDecoder::DismissPictureBuffer(int32 id) {
   DVLOG(3) << "DismissPictureBuffer(" << id << ")";
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

   PictureBufferMap::iterator it = assigned_picture_buffers_.find(id);
   if (it == assigned_picture_buffers_.end()) {
     NOTREACHED() << "Missing picture buffer: " << id;
     return;
   }

   PictureBuffer buffer_to_dismiss = it->second;
   assigned_picture_buffers_.erase(it);

   if (!picture_buffers_at_display_.count(id)) {
     // We can delete the texture immediately as it's not being displayed.
     factories_->DeleteTexture(buffer_to_dismiss.texture_id());
     CHECK_GT(available_pictures_, 0);
     --available_pictures_;
   }
   // Not destroying a texture in display in |picture_buffers_at_display_|.
   // Postpone deletion until after it's returned to us.
 }

 static void ReadPixelsSyncInner(
     const scoped_refptr<media::GpuVideoAcceleratorFactories>& factories,
     uint32 texture_id,
     const gfx::Rect& visible_rect,
     const SkBitmap& pixels,
     base::WaitableEvent* event) {
   factories->ReadPixels(texture_id, visible_rect, pixels);
   event->Signal();
 }

 static void ReadPixelsSync(
     const scoped_refptr<media::GpuVideoAcceleratorFactories>& factories,
     uint32 texture_id,
     const gfx::Rect& visible_rect,
     const SkBitmap& pixels) {
 #if defined(OS_MACOSX)
   // For Mac OS X, just return black. http://crbug.com/425708.
   pixels.eraseARGB(255, 0, 255, 0);
   return;
 #endif

   base::WaitableEvent event(true, false);
   if (!factories->GetTaskRunner()->PostTask(FROM_HERE,
                                             base::Bind(&ReadPixelsSyncInner,
                                                        factories,
                                                        texture_id,
                                                        visible_rect,
                                                        pixels,
                                                        &event)))
     return;
   event.Wait();
 }

 void GpuVideoDecoder::PictureReady(const media::Picture& picture) {
   DVLOG(3) << "PictureReady()";
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

   PictureBufferMap::iterator it =
       assigned_picture_buffers_.find(picture.picture_buffer_id());
   if (it == assigned_picture_buffers_.end()) {
     NOTREACHED() << "Missing picture buffer: " << picture.picture_buffer_id();
     NotifyError(VideoDecodeAccelerator::PLATFORM_FAILURE);
     return;
   }
   const PictureBuffer& pb = it->second;

   // Validate picture rectangle from GPU. This is for sanity/security check
   // even the rectangle is not used in this class.
   if (picture.visible_rect().IsEmpty() ||
       !gfx::Rect(pb.size()).Contains(picture.visible_rect())) {
     NOTREACHED() << "Invalid picture size from VDA: "
                  << picture.visible_rect().ToString() << " should fit in "
                  << pb.size().ToString();
     NotifyError(media::VideoDecodeAccelerator::PLATFORM_FAILURE);
     return;
   }

   // Update frame's timestamp.
   base::TimeDelta timestamp;
   // Some of the VDAs don't support and thus don't provide us with visible
   // size in picture.size, passing coded size instead, so always drop it and
   // use config information instead.
   gfx::Rect visible_rect;
   gfx::Size natural_size;
   GetBufferData(picture.bitstream_buffer_id(), &timestamp, &visible_rect,
                 &natural_size);
   DCHECK(decoder_texture_target_);

   scoped_refptr<VideoFrame> frame(VideoFrame::WrapNativeTexture(
       make_scoped_ptr(new gpu::MailboxHolder(
           pb.texture_mailbox(), decoder_texture_target_, 0 /* sync_point */)),
       BindToCurrentLoop(base::Bind(&GpuVideoDecoder::ReleaseMailbox,
                                    weak_factory_.GetWeakPtr(),
                                    factories_,
                                    picture.picture_buffer_id(),
                                    pb.texture_id())),
       pb.size(),
       visible_rect,
       natural_size,
       timestamp,
       base::Bind(&ReadPixelsSync, factories_, pb.texture_id(), visible_rect)));
   CHECK_GT(available_pictures_, 0);
   --available_pictures_;
   bool inserted =
       picture_buffers_at_display_.insert(std::make_pair(
                                              picture.picture_buffer_id(),
                                              pb.texture_id())).second;
   DCHECK(inserted);

   DeliverFrame(frame);
 }

 void GpuVideoDecoder::DeliverFrame(
     const scoped_refptr<VideoFrame>& frame) {
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

   // During a pending vda->Reset(), we don't accumulate frames.  Drop it on the
   // floor and return.
   if (!pending_reset_cb_.is_null())
     return;

   output_cb_.Run(frame);
 }

 // static
 void GpuVideoDecoder::ReleaseMailbox(
     base::WeakPtr<GpuVideoDecoder> decoder,
     const scoped_refptr<media::GpuVideoAcceleratorFactories>& factories,
     int64 picture_buffer_id,
     uint32 texture_id,
     uint32 release_sync_point) {
   DCHECK(factories->GetTaskRunner()->BelongsToCurrentThread());
   factories->WaitSyncPoint(release_sync_point);

   if (decoder) {
     decoder->ReusePictureBuffer(picture_buffer_id);
     return;
   }
   // It's the last chance to delete the texture after display,
   // because GpuVideoDecoder was destructed.
   factories->DeleteTexture(texture_id);
 }

 void GpuVideoDecoder::ReusePictureBuffer(int64 picture_buffer_id) {
   DVLOG(3) << "ReusePictureBuffer(" << picture_buffer_id << ")";
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

   DCHECK(!picture_buffers_at_display_.empty());
   PictureBufferTextureMap::iterator display_iterator =
       picture_buffers_at_display_.find(picture_buffer_id);
   uint32 texture_id = display_iterator->second;
   DCHECK(display_iterator != picture_buffers_at_display_.end());
   picture_buffers_at_display_.erase(display_iterator);

   if (!assigned_picture_buffers_.count(picture_buffer_id)) {
     // This picture was dismissed while in display, so we postponed deletion.
     factories_->DeleteTexture(texture_id);
     return;
   }

   ++available_pictures_;

   // DestroyVDA() might already have been called.
   if (vda_)
     vda_->ReusePictureBuffer(picture_buffer_id);
 }

 GpuVideoDecoder::SHMBuffer* GpuVideoDecoder::GetSHM(size_t min_size) {
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
   if (available_shm_segments_.empty() ||
       available_shm_segments_.back()->size < min_size) {
     size_t size_to_allocate = std::max(min_size, kSharedMemorySegmentBytes);
     base::SharedMemory* shm = factories_->CreateSharedMemory(size_to_allocate);
     // CreateSharedMemory() can return NULL during Shutdown.
     if (!shm)
       return NULL;
     return new SHMBuffer(shm, size_to_allocate);
   }
   SHMBuffer* ret = available_shm_segments_.back();
   available_shm_segments_.pop_back();
   return ret;
 }

 void GpuVideoDecoder::PutSHM(SHMBuffer* shm_buffer) {
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
   available_shm_segments_.push_back(shm_buffer);
 }

 void GpuVideoDecoder::NotifyEndOfBitstreamBuffer(int32 id) {
   DVLOG(3) << "NotifyEndOfBitstreamBuffer(" << id << ")";
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

   std::map<int32, PendingDecoderBuffer>::iterator it =
       bitstream_buffers_in_decoder_.find(id);
   if (it == bitstream_buffers_in_decoder_.end()) {
     NotifyError(VideoDecodeAccelerator::PLATFORM_FAILURE);
     NOTREACHED() << "Missing bitstream buffer: " << id;
     return;
   }

   PutSHM(it->second.shm_buffer);
   it->second.done_cb.Run(state_ == kError ? kDecodeError : kOk);
   bitstream_buffers_in_decoder_.erase(it);
 }

 GpuVideoDecoder::~GpuVideoDecoder() {
   DVLOG(3) << __FUNCTION__;
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

   if (vda_)
     DestroyVDA();
   DCHECK(assigned_picture_buffers_.empty());

   for (size_t i = 0; i < available_shm_segments_.size(); ++i) {
     available_shm_segments_[i]->shm->Close();
     delete available_shm_segments_[i];
   }
   available_shm_segments_.clear();

   for (std::map<int32, PendingDecoderBuffer>::iterator it =
            bitstream_buffers_in_decoder_.begin();
        it != bitstream_buffers_in_decoder_.end(); ++it) {
     it->second.shm_buffer->shm->Close();
     it->second.done_cb.Run(kAborted);
   }
   bitstream_buffers_in_decoder_.clear();

   if (!pending_reset_cb_.is_null())
     base::ResetAndReturn(&pending_reset_cb_).Run();
 }

 void GpuVideoDecoder::NotifyFlushDone() {
   DVLOG(3) << "NotifyFlushDone()";
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
   DCHECK_EQ(state_, kDrainingDecoder);
   state_ = kDecoderDrained;
   base::ResetAndReturn(&eos_decode_cb_).Run(kOk);
 }

 void GpuVideoDecoder::NotifyResetDone() {
   DVLOG(3) << "NotifyResetDone()";
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
   DCHECK(bitstream_buffers_in_decoder_.empty());

   // This needs to happen after the Reset() on vda_ is done to ensure pictures
   // delivered during the reset can find their time data.
   input_buffer_data_.clear();

   if (!pending_reset_cb_.is_null())
     base::ResetAndReturn(&pending_reset_cb_).Run();
 }

 void GpuVideoDecoder::NotifyError(media::VideoDecodeAccelerator::Error error) {
   DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
   if (!vda_)
     return;

   state_ = kError;

   DLOG(ERROR) << "VDA Error: " << error;
   DestroyVDA();
 }

 void GpuVideoDecoder::DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent()
     const {
   DCHECK(factories_->GetTaskRunner()->BelongsToCurrentThread());
 }

 }  // namespace media
	// Copyright (c) 2012 The Chromium Authors. All rights reserved.
	// Use of this source code is governed by a BSD-style license that can be
	// found in the LICENSE file.

	#include "media/filters/gpu_video_decoder.h"

	#include <algorithm>

	#include "base/bind.h"
	#include "base/callback_helpers.h"
	#include "base/command_line.h"
	#include "base/cpu.h"
	#include "base/message_loop/message_loop.h"
	#include "base/metrics/histogram.h"
	#include "base/stl_util.h"
	#include "base/synchronization/waitable_event.h"
	#include "base/task_runner_util.h"
	#include "gpu/command_buffer/common/mailbox_holder.h"
	#include "media/base/bind_to_current_loop.h"
	#include "media/base/decoder_buffer.h"
	#include "media/base/media_switches.h"
	#include "media/base/pipeline.h"
	#include "media/base/pipeline_status.h"
	#include "media/base/video_decoder_config.h"
	#include "media/filters/gpu_video_accelerator_factories.h"
	#include "third_party/skia/include/core/SkBitmap.h"

	namespace media {

	const char GpuVideoDecoder::kDecoderName[] = "GpuVideoDecoder";

	// Maximum number of concurrent VDA::Decode() operations GVD will maintain.
	// Higher values allow better pipelining in the GPU, but also require more
	// resources.
	enum { kMaxInFlightDecodes = 4 };

	// Size of shared-memory segments we allocate. Since we reuse them we let them
	// be on the beefy side.
	static const size_t kSharedMemorySegmentBytes = 100 << 10;

	GpuVideoDecoder::SHMBuffer::SHMBuffer(base::SharedMemory* m, size_t s)
	: shm(m), size(s) {
	}

	GpuVideoDecoder::SHMBuffer::~SHMBuffer() {}

	GpuVideoDecoder::PendingDecoderBuffer::PendingDecoderBuffer(
	SHMBuffer* s,
	const scoped_refptr<DecoderBuffer>& b,
	const DecodeCB& done_cb)
	: shm_buffer(s), buffer(b), done_cb(done_cb) {
	}

	GpuVideoDecoder::PendingDecoderBuffer::~PendingDecoderBuffer() {}

	GpuVideoDecoder::BufferData::BufferData(
	int32 bbid, base::TimeDelta ts, const gfx::Rect& vr, const gfx::Size& ns)
	: bitstream_buffer_id(bbid), timestamp(ts), visible_rect(vr),
	natural_size(ns) {
	}

	GpuVideoDecoder::BufferData::~BufferData() {}

	GpuVideoDecoder::GpuVideoDecoder(
	const scoped_refptr<GpuVideoAcceleratorFactories>& factories)
	: needs_bitstream_conversion_(false),
	factories_(factories),
	state_(kNormal),
	decoder_texture_target_(0),
	next_picture_buffer_id_(0),
	next_bitstream_buffer_id_(0),
	available_pictures_(0),
	weak_factory_(this) {
	DCHECK(factories_.get());
	}

	void GpuVideoDecoder::Reset(const base::Closure& closure) {
	DVLOG(3) << "Reset()";
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

	if (state_ == kDrainingDecoder) {
	base::MessageLoop::current()->PostTask(
	FROM_HERE,
	base::Bind(
	&GpuVideoDecoder::Reset, weak_factory_.GetWeakPtr(), closure));
	return;
	}

	if (!vda_) {
	base::MessageLoop::current()->PostTask(FROM_HERE, closure);
	return;
	}

	DCHECK(pending_reset_cb_.is_null());
	pending_reset_cb_ = BindToCurrentLoop(closure);

	vda_->Reset();
	}

	static bool IsCodedSizeSupported(const gfx::Size& coded_size) {
	#if defined(OS_WIN)
	// Windows Media Foundation H.264 decoding does not support decoding videos
	// with any dimension smaller than 48 pixels:
	// http://msdn.microsoft.com/en-us/library/windows/desktop/dd797815
	if (coded_size.width() < 48 \|\| coded_size.height() < 48)
	return false;
	#endif

	// Only non-Windows, Ivy Bridge+ platforms can support more than 1920x1080.
	// We test against 1088 to account for 16x16 macroblocks.
	if (coded_size.width() <= 1920 && coded_size.height() <= 1088)
	return true;

	// NOTE: additional autodetection logic may require updating input buffer size
	// selection in platform-specific implementations, such as
	// V4L2VideoDecodeAccelerator.
	base::CPU cpu;
	bool hw_large_video_support =
	CommandLine::ForCurrentProcess()->HasSwitch(
	switches::kIgnoreResolutionLimitsForAcceleratedVideoDecode) \|\|
	((cpu.vendor_name() == "GenuineIntel") && cpu.model() >= 55);
	bool os_large_video_support = true;
	#if defined(OS_WIN)
	os_large_video_support = false;
	#endif
	return os_large_video_support && hw_large_video_support;
	}

	// Report \|status\| to UMA and run \|cb\| with it. This is super-specific to the
	// UMA stat reported because the UMA_HISTOGRAM_ENUMERATION API requires a
	// callsite to always be called with the same stat name (can't parameterize it).
	static void ReportGpuVideoDecoderInitializeStatusToUMAAndRunCB(
	const PipelineStatusCB& cb,
	PipelineStatus status) {
	UMA_HISTOGRAM_ENUMERATION(
	"Media.GpuVideoDecoderInitializeStatus", status, PIPELINE_STATUS_MAX + 1);
	cb.Run(status);
	}

	std::string GpuVideoDecoder::GetDisplayName() const {
	return kDecoderName;
	}

	void GpuVideoDecoder::Initialize(const VideoDecoderConfig& config,
	bool /* low_delay */,
	const PipelineStatusCB& orig_status_cb,
	const OutputCB& output_cb) {
	DVLOG(3) << "Initialize()";
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
	DCHECK(config.IsValidConfig());
	DCHECK(!config.is_encrypted());

	PipelineStatusCB status_cb =
	base::Bind(&ReportGpuVideoDecoderInitializeStatusToUMAAndRunCB,
	BindToCurrentLoop(orig_status_cb));

	bool previously_initialized = config_.IsValidConfig();
	DVLOG(1) << "(Re)initializing GVD with config: "
	<< config.AsHumanReadableString();

	// TODO(posciak): destroy and create a new VDA on codec/profile change
	// (http://crbug.com/260224).
	if (previously_initialized && (config_.profile() != config.profile())) {
	DVLOG(1) << "Codec or profile changed, cannot reinitialize.";
	status_cb.Run(DECODER_ERROR_NOT_SUPPORTED);
	return;
	}

	if (!IsCodedSizeSupported(config.coded_size())) {
	status_cb.Run(DECODER_ERROR_NOT_SUPPORTED);
	return;
	}

	config_ = config;
	needs_bitstream_conversion_ = (config.codec() == kCodecH264);
	output_cb_ = BindToCurrentLoop(output_cb);

	if (previously_initialized) {
	// Reinitialization with a different config (but same codec and profile).
	// VDA should handle it by detecting this in-stream by itself,
	// no need to notify it.
	status_cb.Run(PIPELINE_OK);
	return;
	}

	vda_ = factories_->CreateVideoDecodeAccelerator().Pass();
	if (!vda_ \|\| !vda_->Initialize(config.profile(), this)) {
	status_cb.Run(DECODER_ERROR_NOT_SUPPORTED);
	return;
	}

	DVLOG(3) << "GpuVideoDecoder::Initialize() succeeded.";
	status_cb.Run(PIPELINE_OK);
	}

	void GpuVideoDecoder::DestroyPictureBuffers(PictureBufferMap* buffers) {
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
	for (PictureBufferMap::iterator it = buffers->begin(); it != buffers->end();
	++it) {
	factories_->DeleteTexture(it->second.texture_id());
	}

	buffers->clear();
	}

	void GpuVideoDecoder::DestroyVDA() {
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

	vda_.reset();

	// Not destroying PictureBuffers in \|picture_buffers_at_display_\| yet, since
	// their textures may still be in use by the user of this GpuVideoDecoder.
	for (PictureBufferTextureMap::iterator it =
	picture_buffers_at_display_.begin();
	it != picture_buffers_at_display_.end();
	++it) {
	assigned_picture_buffers_.erase(it->first);
	}
	DestroyPictureBuffers(&assigned_picture_buffers_);
	}

	void GpuVideoDecoder::Decode(const scoped_refptr<DecoderBuffer>& buffer,
	const DecodeCB& decode_cb) {
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
	DCHECK(pending_reset_cb_.is_null());

	DecodeCB bound_decode_cb = BindToCurrentLoop(decode_cb);

	if (state_ == kError \|\| !vda_) {
	bound_decode_cb.Run(kDecodeError);
	return;
	}

	switch (state_) {
	case kDecoderDrained:
	state_ = kNormal;
	// Fall-through.
	case kNormal:
	break;
	case kDrainingDecoder:
	case kError:
	NOTREACHED();
	return;
	}

	DCHECK_EQ(state_, kNormal);

	if (buffer->end_of_stream()) {
	state_ = kDrainingDecoder;
	eos_decode_cb_ = bound_decode_cb;
	vda_->Flush();
	return;
	}

	size_t size = buffer->data_size();
	SHMBuffer* shm_buffer = GetSHM(size);
	if (!shm_buffer) {
	bound_decode_cb.Run(kDecodeError);
	return;
	}

	memcpy(shm_buffer->shm->memory(), buffer->data(), size);
	BitstreamBuffer bitstream_buffer(
	next_bitstream_buffer_id_, shm_buffer->shm->handle(), size);
	// Mask against 30 bits, to avoid (undefined) wraparound on signed integer.
	next_bitstream_buffer_id_ = (next_bitstream_buffer_id_ + 1) & 0x3FFFFFFF;
	DCHECK(!ContainsKey(bitstream_buffers_in_decoder_, bitstream_buffer.id()));
	bitstream_buffers_in_decoder_.insert(
	std::make_pair(bitstream_buffer.id(),
	PendingDecoderBuffer(shm_buffer, buffer, decode_cb)));
	DCHECK_LE(static_cast<int>(bitstream_buffers_in_decoder_.size()),
	kMaxInFlightDecodes);
	RecordBufferData(bitstream_buffer, *buffer.get());

	vda_->Decode(bitstream_buffer);
	}

	void GpuVideoDecoder::RecordBufferData(const BitstreamBuffer& bitstream_buffer,
	const DecoderBuffer& buffer) {
	input_buffer_data_.push_front(BufferData(bitstream_buffer.id(),
	buffer.timestamp(),
	config_.visible_rect(),
	config_.natural_size()));
	// Why this value? Because why not. avformat.h:MAX_REORDER_DELAY is 16, but
	// that's too small for some pathological B-frame test videos. The cost of
	// using too-high a value is low (192 bits per extra slot).
	static const size_t kMaxInputBufferDataSize = 128;
	// Pop from the back of the list, because that's the oldest and least likely
	// to be useful in the future data.
	if (input_buffer_data_.size() > kMaxInputBufferDataSize)
	input_buffer_data_.pop_back();
	}

	void GpuVideoDecoder::GetBufferData(int32 id, base::TimeDelta* timestamp,
	gfx::Rect* visible_rect,
	gfx::Size* natural_size) {
	for (std::list<BufferData>::const_iterator it =
	input_buffer_data_.begin(); it != input_buffer_data_.end();
	++it) {
	if (it->bitstream_buffer_id != id)
	continue;
	*timestamp = it->timestamp;
	*visible_rect = it->visible_rect;
	*natural_size = it->natural_size;
	return;
	}
	NOTREACHED() << "Missing bitstreambuffer id: " << id;
	}

	bool GpuVideoDecoder::NeedsBitstreamConversion() const {
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
	return needs_bitstream_conversion_;
	}

	bool GpuVideoDecoder::CanReadWithoutStalling() const {
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
	return
	next_picture_buffer_id_ == 0 \|\| // Decode() will ProvidePictureBuffers().
	available_pictures_ > 0;
	}

	int GpuVideoDecoder::GetMaxDecodeRequests() const {
	return kMaxInFlightDecodes;
	}

	void GpuVideoDecoder::ProvidePictureBuffers(uint32 count,
	const gfx::Size& size,
	uint32 texture_target) {
	DVLOG(3) << "ProvidePictureBuffers(" << count << ", "
	<< size.width() << "x" << size.height() << ")";
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

	std::vector<uint32> texture_ids;
	std::vector<gpu::Mailbox> texture_mailboxes;
	decoder_texture_target_ = texture_target;
	if (!factories_->CreateTextures(count,
	size,
	&texture_ids,
	&texture_mailboxes,
	decoder_texture_target_)) {
	NotifyError(VideoDecodeAccelerator::PLATFORM_FAILURE);
	return;
	}
	DCHECK_EQ(count, texture_ids.size());
	DCHECK_EQ(count, texture_mailboxes.size());

	if (!vda_)
	return;

	std::vector<PictureBuffer> picture_buffers;
	for (size_t i = 0; i < texture_ids.size(); ++i) {
	picture_buffers.push_back(PictureBuffer(
	next_picture_buffer_id_++, size, texture_ids[i], texture_mailboxes[i]));
	bool inserted = assigned_picture_buffers_.insert(std::make_pair(
	picture_buffers.back().id(), picture_buffers.back())).second;
	DCHECK(inserted);
	}

	available_pictures_ += count;

	vda_->AssignPictureBuffers(picture_buffers);
	}

	void GpuVideoDecoder::DismissPictureBuffer(int32 id) {
	DVLOG(3) << "DismissPictureBuffer(" << id << ")";
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

	PictureBufferMap::iterator it = assigned_picture_buffers_.find(id);
	if (it == assigned_picture_buffers_.end()) {
	NOTREACHED() << "Missing picture buffer: " << id;
	return;
	}

	PictureBuffer buffer_to_dismiss = it->second;
	assigned_picture_buffers_.erase(it);

	if (!picture_buffers_at_display_.count(id)) {
	// We can delete the texture immediately as it's not being displayed.
	factories_->DeleteTexture(buffer_to_dismiss.texture_id());
	CHECK_GT(available_pictures_, 0);
	--available_pictures_;
	}
	// Not destroying a texture in display in \|picture_buffers_at_display_\|.
	// Postpone deletion until after it's returned to us.
	}

	static void ReadPixelsSyncInner(
	const scoped_refptr<media::GpuVideoAcceleratorFactories>& factories,
	uint32 texture_id,
	const gfx::Rect& visible_rect,
	const SkBitmap& pixels,
	base::WaitableEvent* event) {
	factories->ReadPixels(texture_id, visible_rect, pixels);
	event->Signal();
	}

	static void ReadPixelsSync(
	const scoped_refptr<media::GpuVideoAcceleratorFactories>& factories,
	uint32 texture_id,
	const gfx::Rect& visible_rect,
	const SkBitmap& pixels) {
	#if defined(OS_MACOSX)
	// For Mac OS X, just return black. http://crbug.com/425708.
	pixels.eraseARGB(255, 0, 255, 0);
	return;
	#endif

	base::WaitableEvent event(true, false);
	if (!factories->GetTaskRunner()->PostTask(FROM_HERE,
	base::Bind(&ReadPixelsSyncInner,
	factories,
	texture_id,
	visible_rect,
	pixels,
	&event)))
	return;
	event.Wait();
	}

	void GpuVideoDecoder::PictureReady(const media::Picture& picture) {
	DVLOG(3) << "PictureReady()";
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

	PictureBufferMap::iterator it =
	assigned_picture_buffers_.find(picture.picture_buffer_id());
	if (it == assigned_picture_buffers_.end()) {
	NOTREACHED() << "Missing picture buffer: " << picture.picture_buffer_id();
	NotifyError(VideoDecodeAccelerator::PLATFORM_FAILURE);
	return;
	}
	const PictureBuffer& pb = it->second;

	// Validate picture rectangle from GPU. This is for sanity/security check
	// even the rectangle is not used in this class.
	if (picture.visible_rect().IsEmpty() \|\|
	!gfx::Rect(pb.size()).Contains(picture.visible_rect())) {
	NOTREACHED() << "Invalid picture size from VDA: "
	<< picture.visible_rect().ToString() << " should fit in "
	<< pb.size().ToString();
	NotifyError(media::VideoDecodeAccelerator::PLATFORM_FAILURE);
	return;
	}

	// Update frame's timestamp.
	base::TimeDelta timestamp;
	// Some of the VDAs don't support and thus don't provide us with visible
	// size in picture.size, passing coded size instead, so always drop it and
	// use config information instead.
	gfx::Rect visible_rect;
	gfx::Size natural_size;
	GetBufferData(picture.bitstream_buffer_id(), &timestamp, &visible_rect,
	&natural_size);
	DCHECK(decoder_texture_target_);

	scoped_refptr<VideoFrame> frame(VideoFrame::WrapNativeTexture(
	make_scoped_ptr(new gpu::MailboxHolder(
	pb.texture_mailbox(), decoder_texture_target_, 0 /* sync_point */)),
	BindToCurrentLoop(base::Bind(&GpuVideoDecoder::ReleaseMailbox,
	weak_factory_.GetWeakPtr(),
	factories_,
	picture.picture_buffer_id(),
	pb.texture_id())),
	pb.size(),
	visible_rect,
	natural_size,
	timestamp,
	base::Bind(&ReadPixelsSync, factories_, pb.texture_id(), visible_rect)));
	CHECK_GT(available_pictures_, 0);
	--available_pictures_;
	bool inserted =
	picture_buffers_at_display_.insert(std::make_pair(
	picture.picture_buffer_id(),
	pb.texture_id())).second;
	DCHECK(inserted);

	DeliverFrame(frame);
	}

	void GpuVideoDecoder::DeliverFrame(
	const scoped_refptr<VideoFrame>& frame) {
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

	// During a pending vda->Reset(), we don't accumulate frames. Drop it on the
	// floor and return.
	if (!pending_reset_cb_.is_null())
	return;

	output_cb_.Run(frame);
	}

	// static
	void GpuVideoDecoder::ReleaseMailbox(
	base::WeakPtr<GpuVideoDecoder> decoder,
	const scoped_refptr<media::GpuVideoAcceleratorFactories>& factories,
	int64 picture_buffer_id,
	uint32 texture_id,
	uint32 release_sync_point) {
	DCHECK(factories->GetTaskRunner()->BelongsToCurrentThread());
	factories->WaitSyncPoint(release_sync_point);

	if (decoder) {
	decoder->ReusePictureBuffer(picture_buffer_id);
	return;
	}
	// It's the last chance to delete the texture after display,
	// because GpuVideoDecoder was destructed.
	factories->DeleteTexture(texture_id);
	}

	void GpuVideoDecoder::ReusePictureBuffer(int64 picture_buffer_id) {
	DVLOG(3) << "ReusePictureBuffer(" << picture_buffer_id << ")";
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

	DCHECK(!picture_buffers_at_display_.empty());
	PictureBufferTextureMap::iterator display_iterator =
	picture_buffers_at_display_.find(picture_buffer_id);
	uint32 texture_id = display_iterator->second;
	DCHECK(display_iterator != picture_buffers_at_display_.end());
	picture_buffers_at_display_.erase(display_iterator);

	if (!assigned_picture_buffers_.count(picture_buffer_id)) {
	// This picture was dismissed while in display, so we postponed deletion.
	factories_->DeleteTexture(texture_id);
	return;
	}

	++available_pictures_;

	// DestroyVDA() might already have been called.
	if (vda_)
	vda_->ReusePictureBuffer(picture_buffer_id);
	}

	GpuVideoDecoder::SHMBuffer* GpuVideoDecoder::GetSHM(size_t min_size) {
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
	if (available_shm_segments_.empty() \|\|
	available_shm_segments_.back()->size < min_size) {
	size_t size_to_allocate = std::max(min_size, kSharedMemorySegmentBytes);
	base::SharedMemory* shm = factories_->CreateSharedMemory(size_to_allocate);
	// CreateSharedMemory() can return NULL during Shutdown.
	if (!shm)
	return NULL;
	return new SHMBuffer(shm, size_to_allocate);
	}
	SHMBuffer* ret = available_shm_segments_.back();
	available_shm_segments_.pop_back();
	return ret;
	}

	void GpuVideoDecoder::PutSHM(SHMBuffer* shm_buffer) {
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
	available_shm_segments_.push_back(shm_buffer);
	}

	void GpuVideoDecoder::NotifyEndOfBitstreamBuffer(int32 id) {
	DVLOG(3) << "NotifyEndOfBitstreamBuffer(" << id << ")";
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

	std::map<int32, PendingDecoderBuffer>::iterator it =
	bitstream_buffers_in_decoder_.find(id);
	if (it == bitstream_buffers_in_decoder_.end()) {
	NotifyError(VideoDecodeAccelerator::PLATFORM_FAILURE);
	NOTREACHED() << "Missing bitstream buffer: " << id;
	return;
	}

	PutSHM(it->second.shm_buffer);
	it->second.done_cb.Run(state_ == kError ? kDecodeError : kOk);
	bitstream_buffers_in_decoder_.erase(it);
	}

	GpuVideoDecoder::~GpuVideoDecoder() {
	DVLOG(3) << __FUNCTION__;
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();

	if (vda_)
	DestroyVDA();
	DCHECK(assigned_picture_buffers_.empty());

	for (size_t i = 0; i < available_shm_segments_.size(); ++i) {
	available_shm_segments_[i]->shm->Close();
	delete available_shm_segments_[i];
	}
	available_shm_segments_.clear();

	for (std::map<int32, PendingDecoderBuffer>::iterator it =
	bitstream_buffers_in_decoder_.begin();
	it != bitstream_buffers_in_decoder_.end(); ++it) {
	it->second.shm_buffer->shm->Close();
	it->second.done_cb.Run(kAborted);
	}
	bitstream_buffers_in_decoder_.clear();

	if (!pending_reset_cb_.is_null())
	base::ResetAndReturn(&pending_reset_cb_).Run();
	}

	void GpuVideoDecoder::NotifyFlushDone() {
	DVLOG(3) << "NotifyFlushDone()";
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
	DCHECK_EQ(state_, kDrainingDecoder);
	state_ = kDecoderDrained;
	base::ResetAndReturn(&eos_decode_cb_).Run(kOk);
	}

	void GpuVideoDecoder::NotifyResetDone() {
	DVLOG(3) << "NotifyResetDone()";
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
	DCHECK(bitstream_buffers_in_decoder_.empty());

	// This needs to happen after the Reset() on vda_ is done to ensure pictures
	// delivered during the reset can find their time data.
	input_buffer_data_.clear();

	if (!pending_reset_cb_.is_null())
	base::ResetAndReturn(&pending_reset_cb_).Run();
	}

	void GpuVideoDecoder::NotifyError(media::VideoDecodeAccelerator::Error error) {
	DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent();
	if (!vda_)
	return;

	state_ = kError;

	DLOG(ERROR) << "VDA Error: " << error;
	DestroyVDA();
	}

	void GpuVideoDecoder::DCheckGpuVideoAcceleratorFactoriesTaskRunnerIsCurrent()
	const {
	DCHECK(factories_->GetTaskRunner()->BelongsToCurrentThread());
	}

	} // namespace media